Skip to content

Commit b4ab55c

Browse files
authoredMay 1, 2017
Update README.md
1 parent ad38d28 commit b4ab55c

File tree

1 file changed

+11
-0
lines changed

1 file changed

+11
-0
lines changed
 

‎task3/README.md

+11
Original file line numberDiff line numberDiff line change
@@ -1,22 +1,33 @@
11
Компиляция файлов:
2+
23
g++ mapreduce.cpp --std=c++14 -O2 -o mapreduce
4+
35
g++ map1.cpp --std=c++14 -O2 -o map1
6+
47
g++ map2.cpp --std=c++14 -O2 -o map2
8+
59
g++ reduce1.cpp --std=c++14 -O2 -o reduce1
10+
611
g++ reduce2.cpp --std=c++14 -O2 -o reduce2
12+
713
g++ main.cpp --std=c++14 -O2 -o main
814

915
Запуск: <code>./main (mapreduce_file map1_file map2_file reduce1_file reduce2_file file_with_URLs file_with_words output_file</code>.
1016

1117
mapreduce.cpp делает то же самое, что и в предыдущих заданиях.
18+
1219
main.cpp вызывает 4 раза mapreduce.cpp с разными параметрами.
1320

1421
Алгоритм:
1522

1623
1. С помощью map1.cpp строки файла слов преобразуется к виду <code>word '\t' '#'</code>
24+
1725
2. С помощью map2.cpp из всех URL второго входного файла получаем содержимое и название статьи, получаем файл со строками вида <code>word '\t' page_title</code> (работает плохо).
26+
1827
3. С помощью reduce1.cpp из файла, полученного в п.2, получаем файл со строками вида <code>word '\t' page_title1#...#page_titleX</code>.
28+
1929
4. Сливаем файлы из п.1 и п.3
30+
2031
5. Делаем Reduce с помощью reduce2.cpp полученного файла.
2132

2233

0 commit comments

Comments
 (0)