株式会社エーピーコミュニケーションズは、当社エンジニアの市村 幸一郎、永里 洋が翻訳に携わった「Apache Spark徹底入門」が、2024年4月12日に翔泳社より出版されることをお知らせいたします。本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。
■書籍情報
書名:Apache Spark徹底入門
翻訳:長谷川 亮、弥生 隆明、北村 匡彦、竹下 俊一郎、小谷 尚太郎、北岡 早紀、市村 幸一郎、永里 洋、野上 将嗣
定価:4,400円(本体4,000円+税10%)
発売日:2024年04月12日
※ 書店への入荷日は店舗によって異なる場合があります。入荷日については各書店へお問い合わせください。
書籍URL:https://www.shoeisha.co.jp/book/detail/9784798182285
■詳細
Apache Sparkの仕組みとビッグデータ向けの大規模処理とML開発を徹底解説
本書は、ビッグデータを主な対象としたデータ分析フレームワークであるApache Spark、MLflow、Delta Lakeの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データAIの実装者がApache Spark、MLflow およびDelta Lakeを使いこなすための解説を行います。
本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Apache Sparkの導入から解説をはじめ、Spark SQLとデータフレーム、データセットを紹介していきます。そこから、Apache Sparkを利用した実践的な機械学習の方法を解説していきます。本書を通じて、次のことが学習できます。
・Python、SQL、Scala、またはJavaの高レベルの構造化APIの学習
・Spark の操作とSQLエンジンの理解
・Spark 構成とSpark UIを使用したSpark操作の検査、調整、デバッグ
・JSON、Parquet、CSV、Avro、ORC、Hive、S3、またはKafkaといったデータソースへの接続
・構造化ストリーミングを使用してバッチ データとストリーミング データの分析を実行
・オープンソースのDelta LakeとSparkを使用して信頼性の高いデータ パイプラインを構築
・MLlibを使用する機械学習パイプラインの開発、MLflowを使用するモデルの管理、本番化
・[日本語版オリジナルコンテンツ]pandas DataFrame、SparkDataFrameに関する各種データフレームの使い分け
・[日本語版オリジナルコンテンツ]LLMやEnglish SDK for SparkなどAIを活用した新たなコーディングスタイル、LLMの利用方法の実践
※本書は『Learning Spark: Lightning-Fast Data Analytics 2nd Edition』の邦訳です。
【株式会社エーピーコミュニケーションズ 会社概要】
株式会社エーピーコミュニケーションズは、ITインフラ基盤・ネットワークセキュリティのプロフェッショナルとして、システムインテグレーションに加えシステム構築・運用の内製化支援や自動化サービスや、クラウドネイティブ/Platform Engineeringの導入支援、データ&AI基盤に関連するサービスを提供しています。わたしたちは「エンジニアとお客様を笑顔にする」というVisionを掲げ、インフラエンジニアの未来を創るNeoSIerとして工夫と挑戦を行い続けます。
会社名 :株式会社エーピーコミュニケーションズ
代表者 :代表取締役社長 内田 武志
所在地 :東京都千代田区鍛冶町2-9-12 神田徳力ビル 3F
設立 :平成7年11月
事業内容 :システムインテグレーション事業、技術者派遣事業、研究開発事業、サービス開発事業
URL :https://www.ap-com.co.jp/
【報道に関するお問い合わせ】
株式会社エーピーコミュニケーションズ 広報担当: 小林・小松・阿部
TEL:03-5297-8011 FAX:03-5297-8253 Eメール:pr@ap-com.co.jp
【商標名称等に関する表示】
*記載されている会社名及び商品名/サービス名は、各社の商標または登録商標です。