Онлайн или на място, водени от инструктори на живо курсове за обучение на Apache Spark демонстрират чрез практическа практика как Spark се вписва в екосистемата на Big Data и как да използвате Spark за анализ на данни. Обучението на Apache Spark се предлага като „онлайн обучение на живо“ или „обучение на живо на място“. Онлайн обучението на живо (известно още като „дистанционно обучение на живо“) се извършва чрез интерактивен отдалечен работен плот . Обучението на живо на място може да се проведе локално в помещенията на клиента в София или в корпоративните центрове за обучение на NobleProg в София. NobleProg -- Вашият местен доставчик на обучение
Кристал бизнес център
ул. "Осогово" 40, София, Bulgaria, 1303
Кристал Бизнес Център се намира в централната част на София, на ъгъла на ул. „Осогово”. и бул. "Тодор Александров" Сградата е лесно достъпна чрез метрото (само на 50 м от гара Опълченска) и друг обществен транспорт. Общата му площ е 8000 кв.м. Офисната площ е 6171 кв.м.
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към специалисти по данни и инженери на средно ниво, които желаят да използват Google Colab и Apache Spark за обработка и анализ на големи данни.
До края на това обучение участниците ще могат:
Настройте среда с големи данни с помощта на Google Colab и Spark.
Обработвайте и анализирайте ефективно големи набори от данни с Apache Spark.
Визуализирайте големи данни в среда за сътрудничество.
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към разработчици, които желаят да използват и интегрират Spark, Hadoop и Python за обработка, анализиране и трансформиране на големи и сложни масиви от данни.
До края на това обучение участниците ще могат:
Настройте необходимата среда, за да започнете да обработвате големи данни със Spark, Hadoop и Python.
Разберете характеристиките, основните компоненти и архитектурата на Spark и Hadoop.
Научете как да интегрирате Spark, Hadoop и Python за обработка на големи данни.
Разгледайте инструментите в екосистемата на Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka и Flume).
Изградете системи за препоръки за съвместно филтриране, подобни на Netflix, YouTube, Amazon, Spotify и Google.
Използвайте Apache Mahout за мащабиране на алгоритми за машинно обучение.
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към начинаещи до системни администратори на средно ниво, които желаят да разположат, поддържат и оптимизират клъстери на Spark.
До края на това обучение участниците ще могат:
Инсталирайте и конфигурирайте Apache Spark в различни среди.
Управлявайте ресурсите на клъстера и наблюдавайте приложенията на Spark.
Оптимизирайте производителността на клъстерите Spark.
Приложете мерки за сигурност и осигурете висока наличност.
Отстраняване на грешки и отстраняване на често срещани проблеми със Spark.
В това водено от инструктор обучение на живо в София участниците ще се научат как да използват Python и Spark заедно, за да анализират големи данни, докато работят върху практически упражнения.
До края на това обучение участниците ще могат:
Научете как да използвате Spark с Python за анализ на Big Data.
Работете върху упражнения, които имитират случаи от реалния свят.
Използвайте различни инструменти и техники за анализ на големи данни, използвайки PySpark.
Този курс е предназначен за разработчици и специалисти по данни, които искат да разберат и внедрят изкуствения интелект в своите приложения. Специален фокус е върху анализа на данни, разпределения изкуствен интелект и обработката на естествен език.
Анализът на големи данни включва процеса на изследване на големи количества разнообразни набори от данни, за да се разкрият корелации, скрити модели и други полезни прозрения.
Здравната индустрия разполага с огромно количество сложни разнородни медицински и клинични данни. Прилагането на анализ на големи данни върху здравни данни представлява огромен потенциал за извличане на прозрения за подобряване на предоставянето на здравни грижи. Огромността на тези набори от данни обаче поставя големи предизвикателства в анализите и практическите приложения в клинична среда.
В това водено от инструктор обучение на живо (дистанционно) участниците ще се научат как да извършват анализ на големи данни в здравеопазването, докато преминават през поредица от практически лабораторни упражнения на живо.
До края на това обучение участниците ще могат:
Инсталирайте и конфигурирайте инструменти за анализ на големи данни като Hadoop MapReduce и Spark Разбирайте характеристиките на медицинските данни Прилагайте техники за големи данни за работа с медицински данни Изучавайте системи и алгоритми за големи данни в контекста на здравни приложения
Публика
Разработчици Учени по данни
Формат на курса
Част лекция, част дискусия, упражнения и тежка практическа практика.
Забележка
За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
В това водено от инструктор обучение на живо в София участниците ще научат за технологичните предложения и подходите за внедряване за обработка на графични данни. Целта е да се идентифицират обекти от реалния свят, техните характеристики и взаимоотношения, след това да се моделират тези взаимоотношения и да се обработят като данни с помощта на Graph Computing (известен също като Graph Analytics) подход. Започваме с широк преглед и се ограничаваме до конкретни инструменти, докато преминаваме през поредица от казуси, практически упражнения и внедрявания на живо.
До края на това обучение участниците ще могат:
Разберете как данните от графиката се поддържат и преминават.
Изберете най-добрата рамка за дадена задача (от бази данни с графики до рамки за пакетна обработка.)
Приложете Hadoop, Spark, GraphX и Pregel за извършване на графични изчисления в много машини паралелно.
Вижте реални проблеми с големи данни от гледна точка на графики, процеси и обхождания.
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към системни администратори, които желаят да научат как да настройват, разгръщат и управляват Hadoop клъстери в своята организация.
До края на това обучение участниците ще могат:
Инсталирайте и конфигурирайте Apache Hadoop.
Разберете четирите основни компонента в екосистемата Hadoop: HDFS, MapReduce, YARN и Hadoop Common.
Използвайте Hadoop Distributed File System (HDFS), за да мащабирате клъстер до стотици или хиляди възли.
Настройте HDFS да работи като машина за съхранение за локални внедрявания на Spark.
Настройте Spark за достъп до алтернативни решения за съхранение като Amazon S3 и NoSQL системи за бази данни като Redis, Elasticsearch, Couchbase, Aerospike и др.
Извършване на административни задачи като осигуряване, управление, наблюдение и защита на Apache Hadoop клъстер.
Това водено от инструктор обучение на живо в София (онлайн или на място) представя Hortonworks Data Platform (HDP) и превежда участниците през внедряването на решението Spark + Hadoop.
До края на това обучение участниците ще могат:
Използвайте Hortonworks за надеждно изпълнение на Hadoop в голям мащаб.
Обединете възможностите за сигурност, управление и операции на Hadoop с гъвкавите аналитични работни процеси на Spark.
Използвайте Hortonworks, за да проучите, валидирате, сертифицирате и поддържате всеки от компонентите в проект на Spark.
Обработвайте различни видове данни, включително структурирани, неструктурирани, в движение и в покой.
В това водено от инструктор обучение на живо в София (на място или дистанционно), участниците ще се научат как да настройват и интегрират различни Stream Processing рамки със съществуващи системи за съхранение на големи данни и свързани софтуерни приложения и микроуслуги.
До края на това обучение участниците ще могат:
Инсталирайте и конфигурирайте различни Stream Processing рамки, като Spark Streaming и Kafka Streaming.
Разберете и изберете най-подходящата рамка за работата.
Обработване на данни непрекъснато, едновременно и по начин запис по запис.
Интегрирайте Stream Processing решения със съществуващи бази данни, хранилища за данни, езера от данни и др.
Интегрирайте най-подходящата библиотека за обработка на потоци с корпоративни приложения и микроуслуги.
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към специалисти по данни, които желаят да използват стека SMACK за изграждане на платформи за обработка на данни за решения за големи данни.
До края на това обучение участниците ще могат:
Внедрете архитектура на тръбопровод за данни за обработка на големи данни.
Разработете клъстерна инфраструктура с Apache Mesos и Docker.
Анализирайте данните с Spark и Scala.
Управлявайте неструктурирани данни с Apache Cassandra.
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към инженери, които желаят да настроят и внедрят Apache Spark система за обработка на много големи количества данни.
До края на това обучение участниците ще могат:
Инсталирайте и конфигурирайте Apache Spark.
Бързо обработвайте и анализирайте много големи набори от данни.
Разберете разликата между Apache Spark и Hadoop MapReduce и кога да използвате кое.
Интегрирайте Apache Spark с други инструменти за машинно обучение.
Кривата на обучение на Apache Spark бавно се увеличава в началото, необходими са много усилия, за да се получи първата възвръщаемост. Този курс има за цел да премине през първата трудна част. След преминаването на този курс участниците ще разберат основите на Apache Spark, ще разграничат ясно RDD от DataFrame, ще научат Python и Scala API, ще разберат изпълнителите и задачите и т.н. Следвайки най-добрите практики, този курс силно се фокусира върху внедряването в облак, Databricks и AWS. Студентите също ще разберат разликите между AWS EMR и AWS Glue, една от най-новите услуги на Spark на AWS.
ПУБЛИКА:
Инженер по данни, DevOps, Учен по данни
ОБЕКТИВЕН:
Този курс ще представи Apache Spark. Студентите ще научат как Spark се вписва в екосистемата на Big Data и как да използват Spark за анализ на данни. Курсът обхваща обвивка на Spark за интерактивен анализ на данни, вътрешни елементи на Spark, API на Spark, Spark SQL, поточно предаване на Spark и машинно обучение и graphX.
ПУБЛИКА :
Разработчици / анализатори на данни
Това водено от инструктор обучение на живо в София (онлайн или на място) е насочено към учени и разработчици на данни, които желаят да използват Spark NLP, изграден върху Apache Spark, за разработване, внедряване и мащабиране на обработка на текст на естествен език модели и тръбопроводи.
До края на това обучение участниците ще могат:
Настройте необходимата среда за разработка, за да започнете изграждането на NLP тръбопроводи с Spark NLP.
Разберете характеристиките, архитектурата и ползите от използването на Spark NLP.
Използвайте предварително обучените модели, налични в Spark NLP, за да реализирате обработка на текст.
Научете как да създавате, обучавате и мащабирате Spark NLP модели за проекти от производствен клас.
Прилагайте класификация, изводи и анализ на настроенията върху случаи на употреба в реалния свят (клинични данни, прозрения за поведението на клиентите и т.н.).
Spark SQL е модулът на Apache Spark за работа със структурирани и неструктурирани данни. Spark SQL предоставя информация за структурата на данните, както и за извършваното изчисление. Тази информация може да се използва за извършване на оптимизации. Две общи употреби на Spark SQL са: - за изпълнение на SQL заявки. - за четене на данни от съществуваща инсталация на Hive.
В това обучение на живо, ръководено от инструктор (на място или дистанционно), участниците ще се научат как да анализират различни видове набори от данни с помощта на Spark SQL.
До края на това обучение участниците ще могат:
Инсталирайте и конфигурирайте Spark SQL. Извършете анализ на данни с помощта на Spark SQL. Заявки за набори от данни в различни формати. Визуализирайте данните и резултатите от заявките.
Формат на курса
Интерактивна лекция и дискусия. Много упражнения и практика. Практическо внедряване в лабораторна среда на живо.
Опции за персонализиране на курса
За да поискате персонализирано обучение за този курс, моля свържете се с нас, за да уговорим.
MLlib е библиотеката за машинно обучение (ML) на Spark. Целта му е да направи практическото машинно обучение мащабируемо и лесно. Състои се от общи алгоритми и помощни програми за обучение, включително класификация, регресия, клъстериране, съвместно филтриране, намаляване на размерността, както и примитиви за оптимизация от по-ниско ниво и приложни програмни интерфейси за конвейер от по-високо ниво.
Разделя се на два пакета:
spark.mllib съдържа оригиналния API, изграден върху RDD. spark.ml предоставя API от по-високо ниво, изграден върху DataFrames за конструиране на ML тръбопроводи.
Публика
Този курс е насочен към инженери и разработчици, които искат да използват вградена машинна библиотека за Apache Spark
Read more...
Последна актуализация:
Oтзиви от потребители (9)
Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение
Rafal - Nordea
Курс - Apache Spark MLlib
Машинен превод
The live examples
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Курс - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Курс - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
practice tasks
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Курс - Python and Spark for Big Data (PySpark)
The VM I liked very much
The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly
I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Курс - Big Data Analytics in Health
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Курс - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Online Apache Spark training in София
Weekend Apache Spark training in София
Evening Apache Spark courses in София
Apache Spark coaching in София
Apache Spark boot camp in София
Apache Spark instructor in София
Apache Spark trainer in София
Apache Spark instructor-led in София
Apache Spark classes in София
Apache Spark on-site in София
Apache Spark private courses in София
Apache Spark one on one training in София, Apache Spark classes in София, Apache Spark on-site in София, Online Apache Spark training in София, Apache Spark private courses in София, Apache Spark instructor-led in София, Apache Spark coaching in София, Apache Spark boot camp in София, Weekend Apache Spark training in София, Apache Spark instructor in София, Apache Spark one on one training in София, Evening Apache Spark courses in София, Apache Spark trainer in София