Bu uygulamalı eğitim, geliştiricilerin Apache Spark ile yüksek performanslı paralel uygulamalar geliştirmek için ihtiyaç duydukları ana kavramları ve uzmanlıkları sunar. Katılımcılar, yapılandırılmış verileri sorgulamak için Spark SQL’in; çeşitli kaynaklardan gelen veri akışı üzerinde gerçek zamanlı işlem gerçekleştirmek için ise Spark Streaming’in nasıl kullanılacağını öğrenirler. Geliştiriciler ayrıca ETL işleme ve yinelemeli algoritmalar gerçekleştirmek için çekirdek Spark’ı kullanan uygulamalar yazma alıştırmaları yapacaklar. Eğitim, dağıtık dosya sisteminde saklanan büyük veri kümeleriyle nasıl çalışılacağını ve bir Hadoop kümesinde Spark uygulamalarının nasıl çalıştırılacağını içerir. Katılımcılar, bu eğitimi aldıktan sonra gerçek dünyadaki zorluklarla yüzleşmeye, daha hızlı ve daha iyi karar vermeyi sağlayan uygulamalar geliştirmeye ve çok çeşitli kullanım senaryoları, mimarileri ve sektörlere uygulanabilen etkileşimli analizler oluşturmaya hazır olacaklar.
Bu eğitimde neler öğreneceksiniz?
- Verileri Hadoop kümesinde dağıtma, saklama ve işleme
- Spark uygulamalarını bir küme üzerinde yazma, yapılandırma ve dağıtma
- Etkileşimli veri analizi için Spark kabuğunu kullanma
- Spark SQL kullanarak yapılandırılmış verileri işleme ve sorgulama
- Canlı veri akışını işlemek için Spark Streaming’i kullanma
Kimler Katılmalı?
Bu eğitim programlama deneyimi olan geliştiriciler ve mühendisler için tasarlanmıştır. Hadoop ve/veya Spark hakkında önceden bilgi sahibi olunmasına gerek yoktur.