LINEヤフー全社横断データ基盤参考情報一覧

Introduction

LINEヤフーの全社横断データ基盤の構築と管理に関する参考情報一覧です。

情報一覧

※記事の内容は2023年9月までの旧LINE株式会社・旧ヤフー株式会社の情報を含みます。

プロジェクト紹介

LINEとヤフーのデータプラットフォーム統合。大規模なデータを扱うエンジニアの壮大な挑戦
旧LINEと旧ヤフーのデータプラットフォーム統合プロジェクトのひとつであるデータ分析用のノートブック環境「Notebook Integration Project」を主導したデータプラットフォームエンジニアのインタビューです。プロジェクトの概要や課題・成果、今後の目標などを聞きました。
データ活用によりLINEヤフーをさらに飛躍させる。データグループの2人の雄が未来を語る
全体最適を目指したデータの設計・収集・蓄積・分析・可視化・利用などに取り組むデータグループのグループ長佐々木潔とグループCTO 梁ソクホに、組織の現状や今後の展望について話を聞きました。
Apache Hadoop への取り組み
ヤフーではデータ分析基盤として 10年以上 Apache Hadoop を利用しており、今ではあらゆるサービスがHadoopを使って多種多様なログを分析してサービスの改善に取り組んでいます。最も大きなHadoopクラスタでは120PB以上のデータを保存しています。HadoopのOSSコミュニティにも積極的に参加しており、コミッター（PMC）も在籍しています。ここではHadoopへの取り組みを紹介しています。
ヤフーのAIプラットフォーム紹介〜 AI開発をより手軽に
ヤフーにおける機械学習のためのプラットフォームであるAIPFについて紹介します。ここではどのような目的で立ち上げたのか、AIPFを構成する要素は何があるのか、どのように社内で活用されているかについてご紹介します。

イベント登壇記事

大規模Hadoop運用に大切なこと

ヤフーでは、100以上のサービスそして月間約4千万IDものログインユーザー数により日々の利用から蓄積される「マルチビッグデータ」を分析し、ユーザーへの新たな価値提供に力を注いでいます。
本セッションでは、そのデータ利活用を支える基盤技術の紹介を中心に、基盤技術がどのような課題を解決しているかをお伝えしました。

大規模Hadoop運用に大切なこと / YJTC19 in Shibuya B-2 #yjtc from Yahoo!デベロッパーネットワーク

ヤフーのオンプレ ML 基盤の取り組み

2022/3/24に開催した「オンプレML基盤 on Kubernetes」の資料です。機械学習モデルの開発者が、よりモデルの開発にのみ集中できるようにすることを目指して開発している「LakeTahoe（レイクタホ）」について紹介します。

LakeTahoe from Yahoo!デベロッパーネットワーク

MLOpsの「壁」を乗り越える、LINEヤフーの Data Quality as Code

AIプラットフォームにおいてMLOpsの構造的課題にたいするアプローチとして提供した Data Quality as Code についてご紹介します。

Yahoo! JAPANのデータパイプラインで起きた障害とチューニング - Apache Kafka Meetup Japan #5

データ収集基盤として採用している Apache Kafka を運用してい発生した障害と、それにたいしてどのような対処をしたのかをご紹介します。

Yahoo! JAPANのデータパイプラインで起きた障害とチューニング - Apache Kafka Meetup Japan #5 - from Yahoo!デベロッパーネットワーク

Flink@Data Platform - Ingestion Pipeline Redesign and Auto-scaling

データ収集基盤を Apache Flink を使って再構築した話を、どのような課題があってどのようなチャレンジをしたのかについてご紹介します。

Adopting Apache Iceberg on LINE Data Platform

取り扱うデータが大きくなるにつれて様々な問題が出てきたのに対して、テーブルフォーマットを Hive Table から Apache Iceberg を採用した話をご紹介します。

Introducing a Unified, Managed Workflow Service for LINE Data Platform

たくさんのETLワークロードをDataPlatformが提供する標準化された方法で、利用者はコードを書くことなく利用できるようにするために Apache Airflow をベースに開発した Managed Workflow Service についてご紹介します。

LINEヤフー 全社横断データ基盤参考情報一覧

Introduction

情報一覧

プロジェクト紹介

イベント登壇記事

採用情報公式SNSアカウント

LINEヤフー全社横断データ基盤参考情報一覧