Skip to content

Commit

Permalink
added task03
Browse files Browse the repository at this point in the history
  • Loading branch information
simiyutin committed Sep 17, 2023
1 parent 493f393 commit bd118a8
Show file tree
Hide file tree
Showing 60 changed files with 69,122 additions and 61 deletions.
Binary file added .figures/cimg_windows_fail.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added .figures/mandelbrot.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
8 changes: 8 additions & 0 deletions .github/workflows/cmake.yml
Original file line number Diff line number Diff line change
Expand Up @@ -31,3 +31,11 @@ jobs:
- name: aplusb
working-directory: ${{github.workspace}}
run: ./build/aplusb

- name: mandelbrot
working-directory: ${{github.workspace}}/build
run: ./mandelbrot

- name: sum
working-directory: ${{github.workspace}}/build
run: ./sum
30 changes: 27 additions & 3 deletions CMakeLists.txt
Original file line number Diff line number Diff line change
Expand Up @@ -2,9 +2,33 @@ cmake_minimum_required(VERSION 3.1)

add_subdirectory(libs)

project(aplusb)
project(task3)

set(CMAKE_CXX_STANDARD 11)

add_executable(${PROJECT_NAME} src/main.cpp)
target_link_libraries(${PROJECT_NAME} libclew libutils)
# OpenMP позволит распараллеливать циклы на все ядра процессора простыми директивами

find_package(OpenMP)
if (OpenMP_CXX_FOUND)
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${OpenMP_CXX_FLAGS}")
set(CMAKE_EXE_LINKER_FLAGS "${CMAKE_EXE_LINKER_FLAGS} ${OpenMP_EXE_LINKER_FLAGS}")
else()
message(WARNING "OpenMP not found!")
endif()

# convertIntoHeader CMake-функция объявлена в libs/gpu/CMakeLists.txt:71
# Она считывает все байты из файла src/cl/aplusb.cl (т.е. весь исходный код кернела) и преобразует их в массив байтов в файле src/cl/aplusb_cl.h aplusb_kernel
# Обратите внимание что это происходит на этапе компиляции, кроме того необходимо чтобы файл src/cl/aplusb_cl.h был перечислен среди исходников для компиляции при вызове add_executable
convertIntoHeader(src/cl/aplusb.cl src/cl/aplusb_cl.h aplusb_kernel)
add_executable(aplusb src/main_aplusb.cpp src/cl/aplusb_cl.h)
target_link_libraries(aplusb libclew libgpu libutils)

# Аналогично для фрактала Мандельброта
convertIntoHeader(src/cl/mandelbrot.cl src/cl/mandelbrot_cl.h mandelbrot_kernel)
add_executable(mandelbrot src/main_mandelbrot.cpp src/cl/mandelbrot_cl.h)
target_link_libraries(mandelbrot libclew libgpu libimages libutils)

# Для вычисления суммы
convertIntoHeader(src/cl/sum.cl src/cl/sum_cl.h sum_kernel)
add_executable(sum src/main_sum.cpp src/cl/sum_cl.h)
target_link_libraries(sum libclew libgpu libutils)
2 changes: 1 addition & 1 deletion LICENSE
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
MIT License

Copyright (c) 2023 GPGPUCourse
Copyright (c) 2021 GPGPUCourse

Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
Expand Down
85 changes: 73 additions & 12 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,21 +1,82 @@
В этом репозитории предложены задания для В этом репозитории предложены задания для курса по вычислениям на видеокартах 2023.
В этом репозитории предложены задания для курса по вычислениям на видеокартах 2023.

[Остальные задания](https://github.com/GPGPUCourse/GPGPUTasks2023/).

# Задание 1. A+B.
# Задание 3. Фрактал Мандельброта. Сумма чисел.

[![Build Status](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml/badge.svg?branch=task01&event=push)](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml)

Задание
=======
[![Build Status](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml/badge.svg?branch=task03&event=push)](https://github.com/GPGPUCourse/GPGPUTasks2023/actions/workflows/cmake.yml)

0. Сделать fork проекта
1. Прочитать все комментарии подряд и выполнить все **TODO** в файле ``src/main.cpp`` и ``src/cl/aplusb.cl``
2. Отправить **Pull-request** с названием```Task01 <Имя> <Фамилия> <Аффиляция>``` (добавив в описании вывод работы программы в **pre**-тэгах - см. [пример](https://raw.githubusercontent.com/GPGPUCourse/GPGPUTasks2023/task01/.github/pull_request_example.md))
1. Выполнить задания 3.0, 3.1, 3.2 ниже
2. Отправить **Pull-request** с названием```Task03 <Имя> <Фамилия> <Аффиляция>``` (добавив в описании вывод работы программы в **pre**-тэгах - см. [пример](https://raw.githubusercontent.com/GPGPUCourse/GPGPUTasks2023/task03/.github/pull_request_example.md))


**Дедлайн**: 23:59 24 сентября.


Задание 3.0.
=========

Ознакомьтесь с реализацией A+B и какие используются вспомогательные библиотеки:

1. ```src/main_aplusb.cpp``` - основная часть:

- ```gpu::chooseGPUDevice``` - если у вас одно OpenCL-устройство, то можете не обращать внимания, если же несколько - то посмотрите, в каком порядке они печатаются в консоль, и запускайте программу с единственным аргументом запуска - номером используемого устройства
- ```#include "cl/aplusb_cl.h"``` - в прошлом задании исходники кернела подгружались в runtime из текстового файла с диска, это может быть неудобно, поэтому библиотека позволяет сконвертировать текстовый файл с исходником ```aplusb.cl``` в header ```aplusb_cl.h``` с массивом байт состоящим из байт исходного файла (см. подробнее в ```CMakeLists.txt:22```)

2. ```src/cl/aplusb.cl``` - исходник кернела, который на этапе компиляции сохраняется ввиде массива байт в ```src/cl/aplusb_cl.h```. Обратите внимание на дефайн ```WARP_SIZE``` - его выставляет библиотека в зависимости от того, что за устройство используется, см. подробнее ```libs/gpu/libgpu/opencl/engine.cpp:579``` и ```libs/gpu/libgpu/opencl/engine.cpp:198```. Это значение может быть удобно для уменьшения числа ```barrier(...)``` - выставлением лишь там, где нужна синхронизация между потоками из одной work group, но из разного warp/wavefront, т.к. потоки из одного warp/wavefront синхронизированы между собой на уровне железа (но, теоретически, это undefined behaviour)

3. ```CMakeLists.txt``` - OpenMP опционален и полезен для ускорения CPU-стороны, здесь указывается, какие файлы компилировать и с какими библиотеками их слинковывать. add_subdirectory(libs) указывает cmake на библиотеки

4. ```libs/clew``` - та же библиотека, что и в прошлых заданиях. Позволяет в runtime слинковаться с OpenCL драйвером

5. ```libs/gpu``` - обертка над основным функционалом OpenCL и CUDA, позволяющая прозрачно использовать оба API (прозрачно вплоть до вызова кернела)

6. ```libs/images``` - обертка над небольшой библиотекой [CImg](http://cimg.eu/), которая позволяет читать и сохранять картинки и создавать простые окна

7. ```libs/utils``` - вспомогательные вещи вроде быстрого генератора псевдослучайных чисел и секундомера

В этом задании нужно только ознакомиться со структурой.

Задание 3.1. Фрактал Мандельброта
=========

![Mandelbrot](/.figures/mandelbrot.png?raw=true)

Реализуйте расчет фрактала Мандельброта на OpenCL - см. ```src/main_mandelbrot.cpp``` и ```src/cl/mandelbrot.cl```.

Комментарии
-----------

Подробнее про то, что считается, можно прочитать на [wikipedia](https://en.wikipedia.org/wiki/Mandelbrot_set#Escape_time_algorithm).

Эта задача computation-bound, поэтому полученные гигафлопы должны быть довольно близки (например 50% - все еще довольно близко) к теоретическим гигафлопам вашего устройства.

Результат прогрузить в ```gpu_results```. Обратите внимание, что в ```images::Image``` данные из одной строки лежат в памяти подряд, а данные одного столбца - с шагом в размер каждой строки. См. использование ```gpu_results.ptr()```.

Если вы увидите это на Windows:

![CImg fail on Windows](/.figures/cimg_windows_fail.png)

То:
1. Скачайте файл ```GraphicsMagick-1.3.34-Q8-win64-dll.exe``` (отсюда - [ftp://ftp.graphicsmagick.org/pub/GraphicsMagick/windows/](ftp://ftp.graphicsmagick.org/pub/GraphicsMagick/windows/))
2. Установите и не забудьте перезапустить среду разработки (чтобы при выполнении программы ```PATH``` был обновленный после установки GraphicsMagick)

Задание 3.2. Суммирование чисел
==============

Реализуйте суммирование чисел на OpenCL - см. ```src/main_sum.cpp```.

Реализуйте несколько методов:

3.2.1 Суммирование с глобальным атомарным добавлением (просто как бейзлайн)

3.2.2 Суммирование с циклом

3.2.3 Суммирование с циклом и coalesced доступом (интересно сравнение по скорости с не-coalesced версией)

**Дедлайн**: 23:59 17 сентября.
3.2.4 Суммирование с локальной памятью и главным потоком

Коментарии
==========
3.2.5 Суммирование с деревом

Т.к. в ``TODO 6`` исходники кернела считываются по относительному пути ``src/cl/aplusb.cl``, то нужно правильно настроить working directory. Например в случае CLion нужно открыть ``Edit configurations`` -> и указать ``Working directory: .../НАЗВАНИЕПАПКИПРОЕКТА`` (см. [подробнее](https://github.com/GPGPUCourse/GPGPUTasks2023/tree/task01/.figures))
3.2.6 Посмотрите на результаты производительности и попробуйте их проанализировать с учетом своего железа, обсуждения на лекции и ожиданий, какая версия должна была бы стать самой быстрой. Будет круто, если появятся какие-то любопытные наблюдения
2 changes: 2 additions & 0 deletions libs/CMakeLists.txt
Original file line number Diff line number Diff line change
@@ -1,2 +1,4 @@
add_subdirectory(clew)
add_subdirectory(gpu)
add_subdirectory(images)
add_subdirectory(utils)
79 changes: 79 additions & 0 deletions libs/gpu/CMakeLists.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,79 @@
cmake_minimum_required(VERSION 3.1)

project(libgpu)

set(HEADERS
libgpu/opencl/device_info.h
libgpu/opencl/engine.h
libgpu/opencl/enum.h
libgpu/opencl/utils.h
libgpu/context.h
libgpu/device.h
libgpu/gold_helpers.h
libgpu/shared_device_buffer.h
libgpu/shared_host_buffer.h
libgpu/utils.h
libgpu/work_size.h
)

set(SOURCES
libgpu/opencl/device_info.cpp
libgpu/opencl/engine.cpp
libgpu/opencl/enum.cpp
libgpu/opencl/utils.cpp
libgpu/context.cpp
libgpu/device.cpp
libgpu/gold_helpers.cpp
libgpu/shared_device_buffer.cpp
libgpu/shared_host_buffer.cpp
libgpu/utils.cpp
)

set(CUDA_HEADERS
libgpu/cuda/sdk/helper_math.h
libgpu/cuda/cuda_api.h
libgpu/cuda/enum.h
libgpu/cuda/utils.h
)

set(CUDA_SOURCES
libgpu/cuda/cuda_api.cpp
libgpu/cuda/enum.cpp
libgpu/cuda/utils.cpp
)

option(GPU_CUDA_SUPPORT "CUDA support." OFF)

set (LIBRARIES
libclew
libutils)

set(CMAKE_CXX_STANDARD 11)

if (GPU_CUDA_SUPPORT)
find_package (CUDA REQUIRED)

set(HEADERS ${HEADERS} ${CUDA_HEADERS})
set(SOURCES ${SOURCES} ${CUDA_SOURCES})
set(LIBRARIES ${LIBRARIES} ${CUDA_LIBRARIES})

add_definitions(-DCUDA_SUPPORT)
cuda_add_library(${PROJECT_NAME} ${SOURCES} ${HEADERS})
else ()
add_library(${PROJECT_NAME} ${SOURCES} ${HEADERS})
endif ()

target_include_directories(${PROJECT_NAME} PUBLIC ${PROJECT_SOURCE_DIR})
target_link_libraries(${PROJECT_NAME} ${LIBRARIES})

add_executable(hexdumparray libgpu/hexdumparray.cpp)

function(convertIntoHeader sourceFile headerFile arrayName)
add_custom_command(
OUTPUT ${PROJECT_SOURCE_DIR}/${headerFile}

COMMAND hexdumparray ${PROJECT_SOURCE_DIR}/${sourceFile} ${PROJECT_SOURCE_DIR}/${headerFile} ${arrayName}

DEPENDS ${PROJECT_SOURCE_DIR}/${sourceFile} hexdumparray
)
endfunction()
23 changes: 23 additions & 0 deletions libs/gpu/LICENSE
Original file line number Diff line number Diff line change
@@ -0,0 +1,23 @@
MIT License

Copyright (c) 2018 Nikolay Polyarniy
Copyright (c) 2018 GPGPUCourse2018
Copyright (c) 2018 Agisoft LLC

Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:

The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.

THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.
Loading

0 comments on commit bd118a8

Please sign in to comment.