Implementing Parallel Reduction in CUDA

Reduction operations are those that reduce a collection of values to a single value. In this post, I will share how to implement parallel reduction operations using CUDA.

Sequential Sum

Compute the sum of all elements of an array is an excellent example of reduction operation. The sum of an array which values are 13, 27, 15, 14, 33, 2, 24, and 6 is 134.

The interesting question is: How would you compute it? Probably your first answer would be doing something like this (((((((13+27)+15)+14)+33)+2)+24)+6). Am I right?

The problem with this approach is that it is impossible to parallelize. Why? Each step depends on the result of the previous one.

Parallel Sum

Adding values is an associative operation. So, we can try something like this ((13+27)+(15+14))+((33+2)+(24+6))

This way is much better because now we can execute it in parallel!

CUDA

Let’s figure out how to do it using CUDA.

Here is the main idea:

Assuming N as the number of the elements in an array, we start N/2 threads, one thread for each two elements
Each thread computes the sum of the corresponding two elements, storing the result at the position of the first one.
Iteratively, each step:
- the number of threads halved (for example, starting with 4, then 2, then 1)
- doubles the step size between the corresponding two elements (starting with 1, then 2, then 4)
after some iterations, the reduction result will be stored in the first element of the array.

Let’s code

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <iostream>
#include <numeric>
using namespace std;

__global__ void sum(int* input)
{
	const int tid = threadIdx.x;

	auto step_size = 1;
	int number_of_threads = blockDim.x;

	while (number_of_threads > 0)
	{
		if (tid < number_of_threads) // still alive?
		{
			const auto fst = tid * step_size * 2;
			const auto snd = fst + step_size;
			input[fst] += input[snd];
		}

		step_size <<= 1; 
		number_of_threads >>= 1;
	}
}

int main()
{
	const auto count = 8;
	const int size = count * sizeof(int);
	int h[] = {13, 27, 15, 14, 33, 2, 24, 6};

	int* d;
	
	cudaMalloc(&d, size);
	cudaMemcpy(d, h, size, cudaMemcpyHostToDevice);

	sum <<<1, count / 2 >>>(d);

	int result;
	cudaMemcpy(&result, d, sizeof(int), cudaMemcpyDeviceToHost);

	cout << "Sum is " << result << endl;

	getchar();

	cudaFree(d);
	delete[] h;

	return 0;
}

Time to action

In this post, we implemented a primary example of parallel reduction operation in CUDA. But, the pattern we adopted can be used in more sophisticated scenarios.

I strongly recommend you to try to implement other reduction operations (like discovering the max/min values of an array). Now, it would be easy. Right?

Share your thoughts in the comments.

Compartilhe este insight:

Elemar Júnior

Sou fundador e CEO da EximiaCo e atuo como tech trusted advisor ajudando diversas empresas a gerar mais resultados através da tecnologia.

Excelência tecnológica potencializando resultados.

Elemar Júnior

Sou fundador e CEO da EximiaCo e atuo como tech trusted advisor ajudando diversas empresas a gerar mais resultados através da tecnologia.

Excelência tecnológica potencializando resultados.

Mais insights para o seu negócio

Veja mais alguns estudos e reflexões que podem gerar alguns insights para o seu negócio:

Código

Quando ‘null’ é um problema

Como um programador experiente, você precisa lidar com ocorrências NullReferenceException todos os dias. Certo? Eu defendo que este é um...

Code

An Alternative for Supporting long-running processes

There are a lot of scenarios where our applications need to support long-running processes. In this post, I will share...

Código

Achando a Raiz de Equações usando o Método de Newton (em F#)

Este post é uma releitura de um que havia escrito, em 2016, e que se perdeu no “reboot” do blog....

Code

Implementing the Porter Stemming Algorithm in C#

In a previous post, I started an elementary search library using C#. Now, I will improve it adding a Porter...

Código

Exceptions são muito intrusivas

No post anterior, compartilhei um exemplo de como containers podem nos ajudar a deixar o código mais claro sobre os...

Comunicado

Conheça a Eximia!

Dando continuidade a uma jornada iniciada há mais de 20 anos, comunico a fundação da Eximia! Trata-se de uma empresa...

Curso Reputação e Marketing Pessoal

Masterclasses

01 Introdução do curso

02 Por que sua “reputação” é importante?

03 Como você se apresenta?

04 Como você apresenta suas ideias?

05 Como usar Storytelling?

06 Você tem uma dor? Eu tenho o alívio!

07 Escrita efetiva para não escritores

08 Como aumentar (e manter) sua audiência?

09 Gatilhos! Gatilhos!

10 Triple Threat: Domine Produto, Embalagem e Distribuição

11 Estratégias Vencedoras: Desbloqueie o Poder da Teoria dos Jogos

12 Análise SWOT de sua marca pessoal

13 Soterrado por informações? Aprenda a fazer gestão do conhecimento pessoal, do jeito certo

14 Vendo além do óbvio com a Pentad de Burkle

15 Construindo Reputação através de Métricas: A Arte de Alinhar Expectativas com Lag e Lead Measures

16 A Tríade da Liderança: Navegando entre Líder, Liderado e Contexto no Mundo do Marketing Pessoal

17 Análise PESTEL para Marketing Pessoal

18 Canvas de Proposta de Valor para Marca Pessoal

19 Método OKR para Objetivos Pessoais

20 Análise de Competências de Gallup

21 Feedback 360 Graus para Autoavaliação

22 Modelo de Cinco Forças de Porter

23 Estratégia Blue Ocean para Diferenciação Pessoal

24 Análise de Tendências para Previsão de Mercado

25 Design Thinking para Inovação Pessoal

26 Metodologia Agile para Desenvolvimento Pessoal

27 Análise de Redes Sociais para Ampliar Conexões

Lições complementares

28 Apresentando-se do Jeito Certo

29 O mercado remunera raridade? Como evidenciar a sua?

30 O que pode estar te impedindo de ter sucesso

Recomendações de Leituras

31 Aprendendo a qualificar sua reputação do jeito certo

32 Quem é você?

33 Qual a sua “IDEIA”?

34 StoryTelling

35 Você tem uma dor? Eu tenho o alívio!

36 Escrita efetiva para não escritores

37 Gatilhos!

38 Triple Threat: Domine Produto, Embalagem e Distribuição

39 Estratégias Vencedoras: Desbloqueie o Poder da Teoria do Jogos

40 Análise SWOT de sua marca pessoal

Inscrição realizada com sucesso!

No dia da masterclass você receberá um e-mail com um link para acompanhar a aula ao vivo. Até lá!

A sua subscrição foi enviada com sucesso!

Aguarde, em breve entraremos em contato com você para lhe fornecer mais informações sobre como participar da mentoria.

Masterclass

15/07

Pare de dar a solução certa para o problema errado

Muita gente boa quebra a cabeça por dias tentando resolver o que não estava quebrado, simplesmente por tentar dar a resposta certa pro problema errado, mas precisa realmente ser assim?

Crie sua conta

Preencha os dados para iniciar o seu cadastro no plano anual do Clube de Estudos:

Crie sua conta

Preencha os dados para iniciar o seu cadastro no plano mensal do Clube de Estudos:

Implementing Parallel Reduction in CUDA

Sequential Sum

Parallel Sum

CUDA

Time to action

Elemar Júnior

Elemar Júnior

Conecte-se com ElemarJR

Curso Reputação e Marketing Pessoal

Masterclasses

01

Introdução do curso

02

Por que sua “reputação” é importante?

03

Como você se apresenta?

04

Como você apresenta suas ideias?

05

Como usar Storytelling?

06

Você tem uma dor? Eu tenho o alívio!

07

Escrita efetiva para não escritores

08

Como aumentar (e manter) sua audiência?

09

Gatilhos! Gatilhos!

10

Triple Threat: Domine Produto, Embalagem e Distribuição

11

Estratégias Vencedoras: Desbloqueie o Poder da Teoria dos Jogos

12

Análise SWOT de sua marca pessoal

13

Soterrado por informações? Aprenda a fazer gestão do conhecimento pessoal, do jeito certo

14

Vendo além do óbvio com a Pentad de Burkle

15

Construindo Reputação através de Métricas: A Arte de Alinhar Expectativas com Lag e Lead Measures

16

A Tríade da Liderança: Navegando entre Líder, Liderado e Contexto no Mundo do Marketing Pessoal

17

Análise PESTEL para Marketing Pessoal

18

Canvas de Proposta de Valor para Marca Pessoal

19

Método OKR para Objetivos Pessoais

20

Análise de Competências de Gallup

21

Feedback 360 Graus para Autoavaliação

22

Modelo de Cinco Forças de Porter

23

Estratégia Blue Ocean para Diferenciação Pessoal

24

Análise de Tendências para Previsão de Mercado

25

Design Thinking para Inovação Pessoal

26

Metodologia Agile para Desenvolvimento Pessoal

27

Análise de Redes Sociais para Ampliar Conexões

Lições complementares

28

Apresentando-se do Jeito Certo

29

O mercado remunera raridade? Como evidenciar a sua?

30

O que pode estar te impedindo de ter sucesso

Recomendações de Leituras

31

Aprendendo a qualificar sua reputação do jeito certo

32

Quem é você?

33

Qual a sua “IDEIA”?

34

StoryTelling