Inteligência na Web e Big Data

Graduate course, Universidade Federal do ABC, Graduate in Computer Science, 2017

Entender como remodelar algoritmos típicos de Mineração de Dados para a aplicação em ambientes distribuídos. Aprender conceitos de paradigma funcional, paralelismo usando multithread, distribuição de dados, algoritmos online e Apache Spark.

Slides

Avisos:

Informações sobre o mini-curso do prof. Artur: https://folivetti.github.io/talks/2017-11-29-bigdata2017

A entrega dos projetos será no dia 08/12, não haverão apresentações.

Para o Lab4b, resposta do 3b: numCategories = (parsedTrainFeat .flatMap(lambda x: x) .distinct() .map(lambda x: (x[0], 1)) .reduceByKey(lambda x, y: x + y) .sortByKey() .collect())

Para o LAb4b utilize o arquivo dac_sample.txt no repositório do github. Para o LAb4a utilize o arquivo millionsongs.txt no repositório do github.

Salas alteradas para:

4ª FEIRAS……………S-302-2 (DAS 14 AS 16 HORAS)

6º FEIRAS……………S-302-1 (DAS 14 AS 16 HORAS)

Avaliações:

1 Prova (20%), 1 Projeto com seminário (40%) e atividades para entregar (40%).

Notas:

NomeLista 01Lista 02Lista 03Lista 04ProvaProjetoFinal 
Andreia Gusmao0.510.30.31.52.56.1B
Angélica Custódio0.71110.7537.45B
Antonio de Abreu Batista Júnior0.510.750.51.2526B
Carlos Portocarrero100.50.91.252.56.15B
Daniel Gonçalves10.50.90.20.7547.35B
Daniel Rodrigues0000000F
Eduardo Cruz0.751110.750.55C
Eulaliane Gonçalves0.31111.2548.55A
Fabricio Antoniasse10.6111.2548.85A
Fernanda Miyuki Yamada0.751111.2549A
Iara Miranda0.751111.2538A
Ivan Dimitry Ribeiro Zyrianoff11111.549.5A
Laurindo dos Santo0.751111.516.25B
Leandro Otani10.90.810.53.57.7B
Lincoln lima1110.61.251.56.35B
Nelson Gonçalves de Oliveira0.75001001.75F
Noemia Albertini00000.2500.25F
Rafael Di Cesare Giannella1111149A
Rafael Sakurai10.5101.7548.25A
Ricardo Borges0000000F
Rodrigo Pennella0.50.6110.751.55.35C
Thiago Donizetti dos Santos10.6001.752.55.85C
Veruska Ayora0.75110.512.56.75B