среда, 30 ноября 2011 г.

Hello world

Этот блог посвящен hadoop'у - свободной системе распределенных вычислений; "экосистеме", как ее называют создатели.

Решения, типа hadoop'а нужны, когда
  • у вас есть кластер, но вы не знаете, что с ним делать :)
  • вам надо хранить несколько десятков-сотен терабайт данных в одном месте
  • при этом легко обращаться к ним, не вытаскивая харды с бекапом из пыльных коробок
  • или даже вообще: читать и писать данные в онлайне
  • обрабатывать данные на своем кластере за разумное время. Например сортировать, ранжировать, считать статистики, да вообще, делать что потребуется.
  • тратить на разработку не месяцы и годы, а дни и недели
Цель этого блога - рассказать о такой клевой штуке как hadoop, описать полезные программы, которые входят в него, ну и держать народ в курсе событий в мире hadoop разработки.