processos-vs-threads/main.py at main · Mikael-R/processos-vs-threads

History

93 lines (76 loc) · 2.57 KB

Raw

import pandas

import time

import multiprocessing

import threading

FILE_PATH = "dados-inep-enade.csv"

def calcular_media_por_sexo(dataframe):

""""

Calcula a média das notas por sexo em um DataFrame.

"""

return dataframe.groupby("TP_SEXO")["MEDIA_NOTAS"].mean()

def dividir_dataframe(dataframe, n):

"""

Divide um DataFrame em 'n' partes quase iguais.

Retorna uma lista com os pedaços.

"""

partes = []

total_linhas = len(dataframe)

linhas_por_parte = total_linhas // n

for i in range(n):

inicio = i * linhas_por_parte

if i == n - 1:

fim = total_linhas

else:

fim = (i + 1) * linhas_por_parte

parte = dataframe.iloc[inicio:fim]

partes.append(parte)

return partes

def abordagem_processos():

""""

Abordagem usando múltiplos processos para calcular a média das notas por sexo.

"""

partes = dividir_dataframe(data, 4)

with multiprocessing.Pool(processes=4) as pool:

resultados = pool.map(calcular_media_por_sexo, partes)

return pandas.concat(resultados).groupby(level=0).mean()

def abordagem_threads():

""""

Abordagem usando múltiplas threads para calcular a média das notas por sexo.

"""

partes = dividir_dataframe(data, 4)

resultados = []

lock = threading.Lock()

def worker(dataframe):

resultado = calcular_media_por_sexo(dataframe)

with lock:

resultados.append(resultado)

threads = []

for parte in partes:

thread = threading.Thread(target=worker, args=(parte,))

threads.append(thread)

for t in threads:

t.start()

for t in threads:

t.join()

return pandas.concat(resultados).groupby(level=0).mean()

if __name__ == "__main__":

data = pandas.read_csv(FILE_PATH)

inicio_proc = time.time()

media_proc = abordagem_processos()

tempo_proc = time.time() - inicio_proc

inicio_thread = time.time()

media_thread = abordagem_threads()

tempo_thread = time.time() - inicio_thread

melhor = "processos" if tempo_proc < tempo_thread else "threads"

media_geral = (media_proc + media_thread) / 2

sexo_melhor = media_geral.idxmax()

melhor_media = media_geral.max()

print("\n--- RESULTADOS ---")

print("Médias (processos):")

print(media_proc)

print("\nMédias (threads):")

print(media_thread)

print(f"\nTempo (processos): {tempo_proc:.3f} s")

print(f"Tempo (threads): {tempo_thread:.3f} s")

print(f"Melhor desempenho: {melhor}")

print(f"Sexo com melhor média: {sexo_melhor} ({melhor_media:.2f})")

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

main.py

Latest commit

History

main.py

File metadata and controls