le0pard
diff --git a/‎backups/barman.tex‎
Lines changed: 3 additions & 3 deletions b/‎backups/barman.tex‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎backups/wal_e.tex‎
Lines changed: 6 additions & 6 deletions b/‎backups/wal_e.tex‎
Lines changed: 6 additions & 6 deletions
diff --git a/‎clustering/hadoopdb.tex‎
Lines changed: 11 additions & 11 deletions b/‎clustering/hadoopdb.tex‎
Lines changed: 11 additions & 11 deletions
diff --git a/‎extensions/hstore.tex‎
Lines changed: 1 addition & 1 deletion b/‎extensions/hstore.tex‎
Lines changed: 1 addition & 1 deletion
@@ -5,7 +5,7 @@ \subsection{Barman}
 
 \subsubsection{Установка и настройка}
 
-Рассмотрим простом случай с одним экземпляром PostgreSQL (один сервер) и пусть его хост будет <<pghost>>. Наша задача~--- автоматизировать сбор и хранение бэкапов этой базы на другом сервере (его хость будет <<brhost>>). Для взаимодействия эти два сервера должны быть полность открыты по SSH (доступ без пароля, по ключам). Для этого можно использовать authorized\_keys файл.
+Рассмотрим простом случай с одним экземпляром PostgreSQL (один сервер) и пусть его хост будет <<pghost>>. Наша задача~--- автоматизировать сбор и хранение бэкапов этой базы на другом сервере (его хост будет <<brhost>>). Для взаимодействия эти два сервера должны быть полностью открыты по SSH (доступ без пароля, по ключам). Для этого можно использовать authorized\_keys файл.
 
 \begin{lstlisting}[label=lst:barman1,caption=Проверка подключения по SSH]
 # Проверка подключения с сервера PostgreSQL (pghost)
@@ -29,7 +29,7 @@ \subsubsection{Установка и настройка}
 # sudo python setup.py install
 \end{lstlisting}
 
-Теперь перейдем к серверу с PostgreSQL. Для того, что бы barman мог подключатся к базе данных без проблем, нам нужно выставить настройки доступа в конфигах PostgreSQL:
+Теперь перейдем к серверу с PostgreSQL. Для того, чтобы barman мог подключаться к базе данных без проблем, нам нужно выставить настройки доступа в конфигах PostgreSQL:
 
 \begin{lstlisting}[label=lst:barman4,caption=Отредактировать в postgresql.conf]
 listen_adress = '*'
@@ -81,7 +81,7 @@ \subsubsection{Установка и настройка}
 conninfo = host=pghost user=postgres
 \end{lstlisting}
 
-Секция <<main>> (так мы назвали для barman наш PostgreSQL севрер) содержит настроки для подключения к PostgreSQL серверу и базе. Проверим настройки:
+Секция <<main>> (так мы назвали для barman наш PostgreSQL сервер) содержит настроки для подключения к PostgreSQL серверу и базе. Проверим настройки:
 
 \begin{lstlisting}[label=lst:barman9,caption=Проверка barman настроек]
 # barman show-server main
 
@@ -24,7 +24,7 @@ \subsubsection{Установка}
 После успешной установки можно начать работать с WAL-E. 
 
 \subsubsection{Настройка и работа}
-Как уже писалось, WAL-E сливает все данные в AWS S3, поэтому нам потребуются <<Access Key ID>> и <<Secret Access Key>> (эти данные можно найти в акаунте Amazon AWS). Команда для загрузки бэкапа всей базу данный в S3:
+Как уже писалось, WAL-E сливает все данные в AWS S3, поэтому нам потребуются <<Access Key ID>> и <<Secret Access Key>> (эти данные можно найти в акаунте Amazon AWS). Команда для загрузки бэкапа всей базы данных в S3:
 
 \begin{lstlisting}[label=lst:wal-e3,caption=Загрузка бэкапа всей базы данных в S3]
 AWS_SECRET_ACCESS_KEY=... wal-e                     \
@@ -33,7 +33,7 @@ \subsubsection{Настройка и работа}
   backup-push /var/lib/postgresql/9.2/main
 \end{lstlisting}
 
-Где <<s3-prefix>>~--- урл, который содержит имя S3 бакета (bucket) и путь к папке, куда следует складывать резервные копии. Команда для загрузки WAL-логов на S3:
+Где <<s3-prefix>>~--- URL, который содержит имя S3 бакета (bucket) и путь к папке, куда следует складывать резервные копии. Команда для загрузки WAL-логов на S3:
 
 \begin{lstlisting}[label=lst:wal-e4,caption=Загрузка WAL-логов на S3]
 AWS_SECRET_ACCESS_KEY=... wal-e                     \
@@ -68,7 +68,7 @@ \subsubsection{Настройка и работа}
 archive_timeout = 60
 \end{lstlisting}
 
-Лучше указать полный путь к WAL-E (можно узнать командой <<which wal-e>>), поскольку PostgreSQL может его не найти. После этого нужно перегрузить PostgreSQL. В логах базы вы должны увидать что то подобно:
+Лучше указать полный путь к WAL-E (можно узнать командой <<which wal-e>>), поскольку PostgreSQL может его не найти. После этого нужно перегрузить PostgreSQL. В логах базы вы должны увидеть что-то подобное:
 
 \begin{lstlisting}[label=lst:wal-e8,caption=Логи PostgreSQL]
 2012-11-07 14:52:19 UTC LOG:  database system was shut down at 2012-11-07 14:51:40 UTC
@@ -89,9 +89,9 @@ \subsubsection{Настройка и работа}
         DETAIL: Archiving to "s3://cleverdb-pg-backups/pg/wal_005/000000010000000000000002.lzo" complete at 2466.67KiB/s. 
 \end{lstlisting}
 
-Если похожего не видно в логах, тогда нужно смотреть что за ошибка появляется и исправлять её.
+Если ничего похожего в логах не видно, тогда нужно смотреть что за ошибка появляется и исправлять её.
 
-Для того, что бы бэкапить всю базу достаточно выполнить данную команду:
+Для того, чтобы бэкапить всю базу достаточно выполнить данную команду:
 
 \begin{lstlisting}[label=lst:wal-e9,caption=Загрузка бэкапа всей базы данных в S3]
 $ envdir /etc/wal-e.d/env wal-e backup-push /var/lib/postgresql/9.2/main
@@ -123,7 +123,7 @@ \subsubsection{Настройка и работа}
   \label{fig:wal-e3}
 \end{figure}
 
-Данный бэкап лучше делать раз в сутки (например, добавить в crontab). На рис~\ref{fig:wal-e1}-\ref{fig:wal-e3} видно как хранятся бэкапы на S3. Все бэкапы сжаты через lzop\footnote{http://en.wikipedia.org/wiki/Lzop}. Данный алгоритм сжимает хуже чем gzip, но скорость сжатия намного быстрее (приблизительно 25Мб/сек используя 5\% ЦПУ). Чтобы уменьшить нагрузку на чтения с жесткого диска бэкапы отправляются через mbuffer (опцией <<cluster-read-rate-limit>> можно ограничить скорость чтения, если это требуется).
+Данный бэкап лучше делать раз в сутки (например, добавить в crontab). На рис~\ref{fig:wal-e1}-\ref{fig:wal-e3} видно как хранятся бэкапы на S3. Все бэкапы сжаты через lzop\footnote{http://en.wikipedia.org/wiki/Lzop}. Данный алгоритм сжимает хуже чем gzip, но скорость сжатия намного быстрее (приблизительно 25Мб/сек используя 5\% ЦПУ). Чтобы уменьшить нагрузку на чтение с жесткого диска бэкапы отправляются через mbuffer (опцией <<cluster-read-rate-limit>> можно ограничить скорость чтения, если это требуется).
 
 Теперь перейдем к восстановлению данных. Для восстановления базы из резервной копии используется <<backup-fetch>> команда:
 
 
@@ -111,17 +111,17 @@ \section{HadoopDB}
 
 HBase представляет собой распределенную систему хранения больших объемов данных. Подобно реляционным СУБД данные хранятся в 
 виде таблиц, состоящих из строк и столбцов. И даже для доступа к ним предоставляется язык запросов HQL (как ни странно~--- 
-Hadoop Query Language), отдаленно напоминающий более распространенный SQL. Помимо этого предоставляется итерирующмй интерфейс 
+Hadoop Query Language), отдаленно напоминающий более распространенный SQL. Помимо этого предоставляется итерирующий интерфейс 
 для сканирования наборов строк.
 
 Одной из основных особенностей хранения данных в HBase является возможность наличия нескольких значений, 
 соответствующих одной комбинации таблица-строка-столбец, для их различения используется информация о времени добавления записи. 
-На концептуальном уровне таблицы обычно представляют как набор строк, но физически же они хранятся по столбцам, достаточно 
+На концептуальном уровне таблицы обычно представляют как набор строк, но физически же они хранятся по столбцам. Это достаточно 
 важный факт, который стоит учитывать при разработки схемы хранения данных. Пустые ячейки не отображаются каким-либо образом 
 физически в хранимых данных, они просто отсутствуют. Существуют конечно и другие нюансы, но я постарался упомянуть лишь основные.
 
 HQL очень прост по своей сути, если Вы уже знаете SQL, то для изучения его Вам понадобится лишь просмотреть по диагонали 
-коротенький вывод команды help;, занимающий всего пару экранов в консоли. Все те же SELECT, INSERT, UPDATE, DROP и так далее, 
+коротенький вывод команды <<help;>>, занимающий всего пару экранов в консоли. Все те же SELECT, INSERT, UPDATE, DROP и так далее, 
 лишь со слегка измененным синтаксисом.
 
 Помимо обычно командной оболочки HBase Shell, для работы с HBase также предоставлено несколько API для различных языков 
@@ -138,7 +138,7 @@ \section{HadoopDB}
 
 
 \subsection{Установка и настройка}
-Вся настройка ведется на Ubuntu Server операционной системе.
+Вся настройка ведется в операционной системе Ubuntu Server.
 
 \subsubsection{Установка Hadoop}
 Перед тем, как приступить собственно говоря к установке Hadoop, необходимо выполнить два элементарных действия, 
@@ -173,7 +173,7 @@ \subsubsection{Установка Hadoop}
 cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
 \end{lstlisting}
 
-Этого должно быть более чем достаточно, проверить работоспособность соединения можно просто написав:
+Этого должно быть более чем достаточно. Проверить работоспособность соединения можно просто написав:
 \begin{lstlisting}[label=lst:haddop5,caption=Пробуем зайти на ssh без пароля]
 ssh localhost
 \end{lstlisting}
@@ -201,7 +201,7 @@ \subsubsection{Установка Hadoop}
 sudo chown -R hadoop:hadoop /opt/hadoop-data/
 \end{lstlisting}
 
-Далее переходим в /opt/hadoop/conf/hadoop-env.sh и добавляем вначале:
+Далее переходим в /opt/hadoop/conf/hadoop-env.sh и добавляем в начало файла:
 \begin{lstlisting}[label=lst:haddop9,caption=Указываем переменные окружения]
 export JAVA_HOME=/usr/lib/jvm/java-6-openjdk
 export HADOOP_HOME=/opt/hadoop
@@ -400,7 +400,7 @@ \subsubsection{Тестирование}
 При запуске данного Perl скрипта сгенерится данные, которые будут сохранены на HDFS. 
 Поскольку мы настроили систему как единственный кластер, то все данные будут загружены на один HDFS. 
 При работе с большим количеством кластеров данные были бы распределены по кластерам.
-Создадим базу данных, таблицу и загрузим данные, что мы сохранили на HDFS, в нее:
+Создадим базу данных, таблицу и загрузим данные, которые мы сохранили на HDFS, в нее:
 \begin{lstlisting}[label=lst:haddop21,caption=Тестирование]
 $hadoop fs -get /data/SortGrep535MB/part-00000 my_file
 $psql
@@ -413,7 +413,7 @@ \subsubsection{Тестирование}
 COPY grep FROM 'my_file' WITH DELIMITER '|';
 \end{lstlisting}
 
-Теперь настроим HadoopDB. В архиве HadoopDB можно найти пример файла Catalog.properties. Распакуйт его и настройте:
+Теперь настроим HadoopDB. В архиве HadoopDB можно найти пример файла Catalog.properties. Распакуйте его и настройте:
 \begin{lstlisting}[label=lst:haddop22,caption=Тестирование]
 #Properties for Catalog Generation
 ##################################
@@ -448,7 +448,7 @@ \subsubsection{Тестирование}
 ssh_key=id_rsa
 \end{lstlisting}
 
-Создайте файл machines.txt и добавте туда <<localhost>> строчку (без кавычек). Тепер создадим HadoopDB конфиг и скопируем его в HDFS:
+Создайте файл machines.txt и добавьте туда строчку <<localhost>> (без кавычек). Тепер создадим конфиг HadoopDB и скопируем его в HDFS:
 \begin{lstlisting}[label=lst:haddop23,caption=Тестирование]
 java -cp $HADOOP_HOME/lib/hadoopdb.jar \
 > edu.yale.cs.hadoopdb.catalog.SimpleCatalogGenerator \
@@ -469,7 +469,7 @@ \subsubsection{Тестирование}
 \end{lstlisting}
 и поставить <<true>> для <<hadoopdb.config.replication>> в HADOOP\_HOME/conf/hadoop-site.xml.
 
-Теперь мы готовы проверить работы HadoopDB. Теперь можем протестировать поиск по данным, загруженым ранее в БД и HDFS:
+Теперь мы готовы проверить работу HadoopDB. Теперь можем протестировать поиск по данным, загруженым ранее в БД и HDFS:
 \begin{lstlisting}[label=lst:haddop24,caption=Тестирование]
 java -cp $CLASSPATH:hadoopdb.jar \
 > edu.yale.cs.hadoopdb.benchmark.GrepTaskDB \
@@ -663,7 +663,7 @@ \subsection{Заключение}
 не использовалось сжатие данных. Кроме того, Hadoop и Hive~--- это сравнительно молодые проекты с открытыми кодами. 
 
 В HadoopDB применяется некоторый гибрид подходов параллельных СУБД и Hadoop к анализу данных, позволяющий достичь производительности 
-и эффективности параллельных систем баз данных, обеспечивая при этом масштабируемсть, отказоустойчивость и гибкость систем, 
+и эффективности параллельных систем баз данных, обеспечивая при этом масштабируемость, отказоустойчивость и гибкость систем, 
 основанных на MapReduce. Способность HadoopDB к прямому включению Hadoop и программного обеспечения СУБД с открытыми исходными 
 текстами (без изменения кода) делает HadoopDB особенно пригодной для выполнения крупномасштабного анализа данных в будущих 
 рабочих нагрузках.
@@ -1,7 +1,7 @@
 \section{HStore}
 \textbf{Лицензия}: Open Source
 
-HStore~-- расширение, которое реализует тип данных для хранения ключ/значение в пределах одного значения в PostgreSQL (например в одном текстовом поле). Это может быть полезно в различных ситуациях, таких как строки с многими атрибутами, которые редко вибираются, или полу-структурированные данные. Ключи и значения являются простыми текстовыми строками.
+HStore~-- расширение, которое реализует тип данных для хранения ключ/значение в пределах одного значения в PostgreSQL (например, в одном текстовом поле). Это может быть полезно в различных ситуациях, таких как строки с многими атрибутами, которые редко вибираются, или полу-структурированные данные. Ключи и значения являются простыми текстовыми строками.
 
 \subsection{Пример использования}
 Для начала активируем расширение: