@Mail.Ru Group Конференция «Форум Технологий» 2013

Доклад

Hadoop

Кай расскажет о принципах работы Apache Hadoop: как хранить огромные массивы даных в распределенной файловой системе HDFS, как запускать наборы распределенных задач c использованием MapReduce и многое другое. Кай является инструктором в Cloudera по данному направлению и обладает отличной экспертизой в вопросах баз данных и кластерных систем хранения и обработки данных.

Get Adobe Flash player

Вопросы с сайта / с Твиттера / с SMS, заданные во время доклада

Is Hadoop currently best base for creating future Artificial General Intelegence systems? (markygre@)

I don't know if it's the best solution, but a lot of people use Mahout (http://mahout.apache.org/) as a machine learning library. Its library includes code for regression, recommendation, classification and many other common algorithms.

Please point out Hadoop advantages when comparing to google big table? (markygre@)

HBase is an implementation of Google's BigTable ideas. The data model and access pattern are very much the same. The difference is that you can't download BigTable and run it yourself, Google only provides you with BigTable access when you store your data on their servers (http://code.google.com/appengine/). HBase is open source and you can run it on your machines.