-
Notifications
You must be signed in to change notification settings - Fork 53
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
Showing
60 changed files
with
69,122 additions
and
61 deletions.
There are no files selected for viewing
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,21 +1,82 @@ | ||
В этом репозитории предложены задания для В этом репозитории предложены задания для курса по вычислениям на видеокартах 2023. | ||
В этом репозитории предложены задания для курса по вычислениям на видеокартах 2023. | ||
|
||
[Остальные задания](https://github.com/GPGPUCourse/GPGPUTasks2023/). | ||
|
||
# Задание 1. A+B. | ||
# Задание 3. Фрактал Мандельброта. Сумма чисел. | ||
|
||
[![Build Status](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml/badge.svg?branch=task01&event=push)](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml) | ||
|
||
Задание | ||
======= | ||
[![Build Status](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml/badge.svg?branch=task03&event=push)](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml) | ||
|
||
0. Сделать fork проекта | ||
1. Прочитать все комментарии подряд и выполнить все **TODO** в файле ``src/main.cpp`` и ``src/cl/aplusb.cl`` | ||
2. Отправить **Pull-request** с названием```Task01 <Имя> <Фамилия> <Аффиляция>``` (добавив в описании вывод работы программы в **pre**-тэгах - см. [пример](https://raw.githubusercontent.com/GPGPUCourse/GPGPUTasks2023/task01/.github/pull_request_example.md)) | ||
1. Выполнить задания 3.0, 3.1, 3.2 ниже | ||
2. Отправить **Pull-request** с названием```Task03 <Имя> <Фамилия> <Аффиляция>``` (добавив в описании вывод работы программы в **pre**-тэгах - см. [пример](https://raw.githubusercontent.com/GPGPUCourse/GPGPUTasks2023/task03/.github/pull_request_example.md)) | ||
|
||
|
||
**Дедлайн**: 23:59 24 сентября. | ||
|
||
|
||
Задание 3.0. | ||
========= | ||
|
||
Ознакомьтесь с реализацией A+B и какие используются вспомогательные библиотеки: | ||
|
||
1. ```src/main_aplusb.cpp``` - основная часть: | ||
|
||
- ```gpu::chooseGPUDevice``` - если у вас одно OpenCL-устройство, то можете не обращать внимания, если же несколько - то посмотрите, в каком порядке они печатаются в консоль, и запускайте программу с единственным аргументом запуска - номером используемого устройства | ||
- ```#include "cl/aplusb_cl.h"``` - в прошлом задании исходники кернела подгружались в runtime из текстового файла с диска, это может быть неудобно, поэтому библиотека позволяет сконвертировать текстовый файл с исходником ```aplusb.cl``` в header ```aplusb_cl.h``` с массивом байт состоящим из байт исходного файла (см. подробнее в ```CMakeLists.txt:22```) | ||
|
||
2. ```src/cl/aplusb.cl``` - исходник кернела, который на этапе компиляции сохраняется ввиде массива байт в ```src/cl/aplusb_cl.h```. Обратите внимание на дефайн ```WARP_SIZE``` - его выставляет библиотека в зависимости от того, что за устройство используется, см. подробнее ```libs/gpu/libgpu/opencl/engine.cpp:579``` и ```libs/gpu/libgpu/opencl/engine.cpp:198```. Это значение может быть удобно для уменьшения числа ```barrier(...)``` - выставлением лишь там, где нужна синхронизация между потоками из одной work group, но из разного warp/wavefront, т.к. потоки из одного warp/wavefront синхронизированы между собой на уровне железа (но, теоретически, это undefined behaviour) | ||
|
||
3. ```CMakeLists.txt``` - OpenMP опционален и полезен для ускорения CPU-стороны, здесь указывается, какие файлы компилировать и с какими библиотеками их слинковывать. add_subdirectory(libs) указывает cmake на библиотеки | ||
|
||
4. ```libs/clew``` - та же библиотека, что и в прошлых заданиях. Позволяет в runtime слинковаться с OpenCL драйвером | ||
|
||
5. ```libs/gpu``` - обертка над основным функционалом OpenCL и CUDA, позволяющая прозрачно использовать оба API (прозрачно вплоть до вызова кернела) | ||
|
||
6. ```libs/images``` - обертка над небольшой библиотекой [CImg](http://cimg.eu/), которая позволяет читать и сохранять картинки и создавать простые окна | ||
|
||
7. ```libs/utils``` - вспомогательные вещи вроде быстрого генератора псевдослучайных чисел и секундомера | ||
|
||
В этом задании нужно только ознакомиться со структурой. | ||
|
||
Задание 3.1. Фрактал Мандельброта | ||
========= | ||
|
||
![Mandelbrot](/.figures/mandelbrot.png?raw=true) | ||
|
||
Реализуйте расчет фрактала Мандельброта на OpenCL - см. ```src/main_mandelbrot.cpp``` и ```src/cl/mandelbrot.cl```. | ||
|
||
Комментарии | ||
----------- | ||
|
||
Подробнее про то, что считается, можно прочитать на [wikipedia](https://en.wikipedia.org/wiki/Mandelbrot_set#Escape_time_algorithm). | ||
|
||
Эта задача computation-bound, поэтому полученные гигафлопы должны быть довольно близки (например 50% - все еще довольно близко) к теоретическим гигафлопам вашего устройства. | ||
|
||
Результат прогрузить в ```gpu_results```. Обратите внимание, что в ```images::Image``` данные из одной строки лежат в памяти подряд, а данные одного столбца - с шагом в размер каждой строки. См. использование ```gpu_results.ptr()```. | ||
|
||
Если вы увидите это на Windows: | ||
|
||
![CImg fail on Windows](/.figures/cimg_windows_fail.png) | ||
|
||
То: | ||
1. Скачайте файл ```GraphicsMagick-1.3.34-Q8-win64-dll.exe``` (отсюда - [ftp://ftp.graphicsmagick.org/pub/GraphicsMagick/windows/](ftp://ftp.graphicsmagick.org/pub/GraphicsMagick/windows/)) | ||
2. Установите и не забудьте перезапустить среду разработки (чтобы при выполнении программы ```PATH``` был обновленный после установки GraphicsMagick) | ||
|
||
Задание 3.2. Суммирование чисел | ||
============== | ||
|
||
Реализуйте суммирование чисел на OpenCL - см. ```src/main_sum.cpp```. | ||
|
||
Реализуйте несколько методов: | ||
|
||
3.2.1 Суммирование с глобальным атомарным добавлением (просто как бейзлайн) | ||
|
||
3.2.2 Суммирование с циклом | ||
|
||
3.2.3 Суммирование с циклом и coalesced доступом (интересно сравнение по скорости с не-coalesced версией) | ||
|
||
**Дедлайн**: 23:59 17 сентября. | ||
3.2.4 Суммирование с локальной памятью и главным потоком | ||
|
||
Коментарии | ||
========== | ||
3.2.5 Суммирование с деревом | ||
|
||
Т.к. в ``TODO 6`` исходники кернела считываются по относительному пути ``src/cl/aplusb.cl``, то нужно правильно настроить working directory. Например в случае CLion нужно открыть ``Edit configurations`` -> и указать ``Working directory: .../НАЗВАНИЕПАПКИПРОЕКТА`` (см. [подробнее](https://github.com/GPGPUCourse/GPGPUTasks2023/tree/task01/.figures)) | ||
3.2.6 Посмотрите на результаты производительности и попробуйте их проанализировать с учетом своего железа, обсуждения на лекции и ожиданий, какая версия должна была бы стать самой быстрой. Будет круто, если появятся какие-то любопытные наблюдения |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,2 +1,4 @@ | ||
add_subdirectory(clew) | ||
add_subdirectory(gpu) | ||
add_subdirectory(images) | ||
add_subdirectory(utils) |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,79 @@ | ||
cmake_minimum_required(VERSION 3.1) | ||
|
||
project(libgpu) | ||
|
||
set(HEADERS | ||
libgpu/opencl/device_info.h | ||
libgpu/opencl/engine.h | ||
libgpu/opencl/enum.h | ||
libgpu/opencl/utils.h | ||
libgpu/context.h | ||
libgpu/device.h | ||
libgpu/gold_helpers.h | ||
libgpu/shared_device_buffer.h | ||
libgpu/shared_host_buffer.h | ||
libgpu/utils.h | ||
libgpu/work_size.h | ||
) | ||
|
||
set(SOURCES | ||
libgpu/opencl/device_info.cpp | ||
libgpu/opencl/engine.cpp | ||
libgpu/opencl/enum.cpp | ||
libgpu/opencl/utils.cpp | ||
libgpu/context.cpp | ||
libgpu/device.cpp | ||
libgpu/gold_helpers.cpp | ||
libgpu/shared_device_buffer.cpp | ||
libgpu/shared_host_buffer.cpp | ||
libgpu/utils.cpp | ||
) | ||
|
||
set(CUDA_HEADERS | ||
libgpu/cuda/sdk/helper_math.h | ||
libgpu/cuda/cuda_api.h | ||
libgpu/cuda/enum.h | ||
libgpu/cuda/utils.h | ||
) | ||
|
||
set(CUDA_SOURCES | ||
libgpu/cuda/cuda_api.cpp | ||
libgpu/cuda/enum.cpp | ||
libgpu/cuda/utils.cpp | ||
) | ||
|
||
option(GPU_CUDA_SUPPORT "CUDA support." OFF) | ||
|
||
set (LIBRARIES | ||
libclew | ||
libutils) | ||
|
||
set(CMAKE_CXX_STANDARD 11) | ||
|
||
if (GPU_CUDA_SUPPORT) | ||
find_package (CUDA REQUIRED) | ||
|
||
set(HEADERS ${HEADERS} ${CUDA_HEADERS}) | ||
set(SOURCES ${SOURCES} ${CUDA_SOURCES}) | ||
set(LIBRARIES ${LIBRARIES} ${CUDA_LIBRARIES}) | ||
|
||
add_definitions(-DCUDA_SUPPORT) | ||
cuda_add_library(${PROJECT_NAME} ${SOURCES} ${HEADERS}) | ||
else () | ||
add_library(${PROJECT_NAME} ${SOURCES} ${HEADERS}) | ||
endif () | ||
|
||
target_include_directories(${PROJECT_NAME} PUBLIC ${PROJECT_SOURCE_DIR}) | ||
target_link_libraries(${PROJECT_NAME} ${LIBRARIES}) | ||
|
||
add_executable(hexdumparray libgpu/hexdumparray.cpp) | ||
|
||
function(convertIntoHeader sourceFile headerFile arrayName) | ||
add_custom_command( | ||
OUTPUT ${PROJECT_SOURCE_DIR}/${headerFile} | ||
|
||
COMMAND hexdumparray ${PROJECT_SOURCE_DIR}/${sourceFile} ${PROJECT_SOURCE_DIR}/${headerFile} ${arrayName} | ||
|
||
DEPENDS ${PROJECT_SOURCE_DIR}/${sourceFile} hexdumparray | ||
) | ||
endfunction() |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,23 @@ | ||
MIT License | ||
|
||
Copyright (c) 2018 Nikolay Polyarniy | ||
Copyright (c) 2018 GPGPUCourse2018 | ||
Copyright (c) 2018 Agisoft LLC | ||
|
||
Permission is hereby granted, free of charge, to any person obtaining a copy | ||
of this software and associated documentation files (the "Software"), to deal | ||
in the Software without restriction, including without limitation the rights | ||
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell | ||
copies of the Software, and to permit persons to whom the Software is | ||
furnished to do so, subject to the following conditions: | ||
|
||
The above copyright notice and this permission notice shall be included in all | ||
copies or substantial portions of the Software. | ||
|
||
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR | ||
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, | ||
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE | ||
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER | ||
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, | ||
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE | ||
SOFTWARE. |
Oops, something went wrong.