Релиз PoCL 5.0 с независимой реализацией стандарта OpenCL

Опубликован релиз проекта PoCL 5.0 (Portable Computing Language OpenCL), развивающего реализацию стандарта OpenCL, независимую от производителей графических ускорителей и позволяющую использовать различные бэкенды для выполнения OpenCL-ядер на разных типах графических и центральных процессоров. Код проекта распространяется под лицензией MIT. Поддерживается работа на платформах X86_64, MIPS32, ARM v7, AMD HSA APU, NVIDIA GPU и различных специализированных ASIP (Application-Specific Instruction-set Processor) и TTA-процессорах (Transport Triggered Architecture) c архитектурой VLIW.

Реализация компилятора ядер OpenCL построена на базе LLVM, а в качестве фронтэнда для OpenCL C используется Clang. Для обеспечения должной переносимости и производительности компилятор ядер OpenCL может генерировать комбинированные функции, которые могут использовать различные аппаратные ресурсы для распараллеливания выполнения кода, такие как VLIW, суперскалярность, SIMD, SIMT, многоядерность и многопоточность. Имеется поддержка ICD-драйверов
(Installable Client Driver). Присутствуют бэкенды для обеспечения работы через CPU, ASIP (TCE/TTA), GPU на базе архитектуры HSA и GPU NVIDIA (через libcuda).

В новой версии:

  • Реализован новый бэкенд “Remote“, предназначенный для организации распределённых вычислений через вынос обработки команд OpenCL на другие хосты в сети, на которых запущен фоновый процесс pocld.
  • В драйвере CUDA реализованы дополнительные возможности и расширения OpenCL 3.0, такие как атомарные операции, переменные с ограниченной областью видимости, подгруппы intel_sub_group_shuffle, intel_sub_group_shuffle_xor, get_sub_group_local_id, sub_group_barrier и sub_group_ballot.
  • Улучшена поддержка CPU на базе архитектуры RISC-V. Работа PoCL протестирована на плате Starfive VisionFive 2 с загруженным окружением Ubuntu 23.10 с LLVM 17 и GCC 13.2.
  • Реализовано расширение cl_ext_float_atomics с поддержкой FP32 и FP64.
  • Реализация расширения cl_khr_command_buffer обновлена до версии 0.9.4.
  • Предложен экспериментальный бэкенд AlmaIF для FPGA.
  • Удалена незавершённая поддержка промежуточного представления шейдеров SPIR 1.x/2.0. В качестве рекомендованного промежуточного языка шейдеров заявлен SPIR-V.
  • Добавлена поддержка Clang/LLVM 17.0. Объявлена устаревшей поддержка Clang/LLVM 10-13.
Release. Ссылка here.