add bfloat16 support for CUDA Neg kernel #18306

prathikr · 2023-11-06T23:27:37Z

Description

Registers BFloat16 datatype as valid input type for CUDA Neg Kernel.

Motivation and Context

Enabling meta-llama/Llama-2-70b to be finetuned with ONNX Runtime training.

onnxruntime/core/providers/cuda/math/unary_elementwise_ops.cc

onnxruntime/core/providers/cuda/math/unary_elementwise_ops_impl.cu

### Description  Registers BFloat16 datatype as valid input type for CUDA Neg Kernel. ### Motivation and Context  Enabling `meta-llama/Llama-2-70b` to be finetuned with ONNX Runtime training. --------- Co-authored-by: Prathik Rao <[email protected]@orttrainingdev8.d32nl1ml4oruzj4qz3bqlggovf.px.internal.cloudapp.net>

add bfloat16 support

5dcdbdb

prathikr changed the title ~~add bfloat16 support~~ add bfloat16 support for CUDA Neg kernel Nov 6, 2023

Prathik Rao added 8 commits November 7, 2023 18:33

Merge remote-tracking branch 'origin' into prathikrao/neg-bfloat16

2756093

remove cpu test since we are not enabling bfloat16 for cpu

0e2c7b2

Merge remote-tracking branch 'origin' into prathikrao/neg-bfloat16

6d24d3d

update types

4ea85c7

adjust types more

5929b08

lint

33d3c24

lint

7330f2c

docs OperatorKernels.md update

1a05727

hanbitmyths reviewed Nov 8, 2023

View reviewed changes

onnxruntime/core/providers/cuda/math/unary_elementwise_ops.cc Outdated Show resolved Hide resolved

Prathik Rao added 2 commits November 8, 2023 04:58

use X for bfloat16

8510551

use X for bfloat16 cont

84b2456

prathikr requested a review from hanbitmyths November 8, 2023 05:04

hanbitmyths reviewed Nov 8, 2023

View reviewed changes

onnxruntime/core/providers/cuda/math/unary_elementwise_ops.cc Show resolved Hide resolved

hanbitmyths reviewed Nov 8, 2023

View reviewed changes

onnxruntime/core/providers/cuda/math/unary_elementwise_ops_impl.cu Show resolved Hide resolved

Prathik Rao added 2 commits November 8, 2023 06:04

add comment

5791cdf

add comment cont

4a7b8a4

prathikr requested a review from hanbitmyths November 8, 2023 06:09

hanbitmyths approved these changes Nov 8, 2023

View reviewed changes

Merge remote-tracking branch 'origin' into prathikrao/neg-bfloat16

4a46b62

askhade approved these changes Nov 8, 2023

View reviewed changes

prathikr merged commit 7a3da45 into main Nov 9, 2023
95 checks passed

prathikr deleted the prathikrao/neg-bfloat16 branch November 9, 2023 02:32

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

add bfloat16 support for CUDA Neg kernel #18306

add bfloat16 support for CUDA Neg kernel #18306

prathikr commented Nov 6, 2023

add bfloat16 support for CUDA Neg kernel #18306

add bfloat16 support for CUDA Neg kernel #18306

Conversation

prathikr commented Nov 6, 2023

Description

Motivation and Context