Здарова, бигдатник!

Сегодня поговорим о bigdata и её возможностях, которые она предоставляет. Тут так
много всего, конечно, но давай попробуем прямо верхушку айсберга для начала
цепануть.
Сперва давай с тобой закрепим, что же это за бигдата такая. Bigdata – это огромные
объемы данных, которые поступают в организации со всех возможных источников:
социальных сетей, мобильных устройств, банковских транзакций и т. д. Эти данные не
могут быть обработаны с помощью обычных средств, таких как Excel или Access, или даже
обычных БД-шек. Для работы с bigdata требуются специализированные инструменты и
знания, так как нужно управлять данными с различных источников, не имеющих единой
структуры.
Для того, чтобы немного «прошариться» в теме, во-первых, нужно хотя бы немного уметь
в программирование. В бигдате очень распространен Python или Java. Вариант попроще –
начать с питона, но если хочешь так сказать по правильному, то сильно рекомендую
начать с какого-то более низкоуровнего языка программирования (Java подойдет
отлично). После минимального изучения этого самого «одного из» ты и будешь в
последствии писать софт, который может обрабатывать и анализировать огромные
объемы данных. Огромным бонусом для работы с «бигдатой» будет, если ты понимаешь
основы статистики и машинного обучения.Во-вторых, нужно изучить специализированные инструменты для работы с bigdata. В
основном вся эта тема крутиться вокруг Hadoop, Apache Spark, NoSQL-баз данных. Каждый
из этих инструментов имеет свои особенности и требует определенных навыков для
работы.
Сразу скажу, что это такая ниша, где постоянно происходят изменения и появляются
новые инструменты, что в целом конечно можно сказать про ИТ, но тут особенно. Чтобы
быть в тренде и иметь возможность реализовывать новые идеи, нужно постоянно
развиваться и учиться и самое главное быть готовым поглощать новые знания.
Я побуду чуть тривиальным и скажу, что самый простой и доступный способ – это онлайн-
курсы.
Я тебе тут торрентов закину немного, может не супер актуально, но я бы
начал с этого.
Список онлайн курсов по bigdata:
- Раз
- Два
Ты, конечно, можешь посмотреть и скачать почти все курсы с торрентов, однако многие
купленные курсы предоставляют сертификаты, которые можно использовать при поиске
работы, но я скажу честно: сертификаты – говно и не помогают, а вот мотивация на
купленном курсе куда выше, чем на пиратском.
Однако, если ты хочешь получить более глубокие знания и опыт работы с реальными
данными, то посмотри в сторону прохождения стажировок или работу в компаниях,
которые занимаются bigdata. Это поможет получить практические навыки и опыт работы в
команде, а это, наверное, самая ценная вещь. В плане стажировок очень хорош Сбер, там
отличная внутренняя система онбординга и обучение в целом очень структурировано.
Если ты уже имеешь некоторый опыт работы с bigdata, то есть отличная возможность:
пройти сертификационные экзамены. Это позволит официально подтвердить свои знания
и умения.
• Сертификация от Amazon
Кроме того, сейчас куча возможностей поучаствовать в конференциях и мероприятиях,
которые посвящены теме bigdata. Это поможет расширить кругозор и получить новые
знания, а также знакомиться с ребятами в теме и возможными работодателями.
Короче, если ты хочешь стать настоящим трушным data scientist’ом, то не зацикливайся на
одном инструменте или языке программирования, но это потом, когда чуть разберешься.
Изучай новые технологии и экспериментируй. В конце концов, bigdata – это область, где
креативность и инновации ценятся выше всего.В целом, «ты да я, да мы с тобой» рассмотрели основные шаги, которые помогут тебе
потихоньку врываться в «бигдату». Не спорю, тут нужно много усилий и постоянное
развитие.
Удачи в начинаниях!
Спишемся!