LINEヤフー DE統括本部参考情報一覧

Introduction

LINEヤフーのデータ基盤の構築と管理を担当している、データエンジニアリング統括本部に関する参考情報一覧です。

情報一覧

※記事の内容は2023年9月までの旧LINE株式会社・旧ヤフー株式会社の情報を含みます。

組織・業務紹介

プロジェクト紹介

イベント登壇記事

大規模Hadoop運用に大切なこと

ヤフーでは、100以上のサービスそして月間約4千万IDものログインユーザー数により日々の利用から蓄積される「マルチビッグデータ」を分析し、ユーザーへの新たな価値提供に力を注いでいます。
本セッションでは、そのデータ利活用を支える基盤技術の紹介を中心に、基盤技術がどのような課題を解決しているかをお伝えしました。

ヤフーのオンプレ ML 基盤の取り組み

2022/3/24に開催した「オンプレML基盤 on Kubernetes」の資料です。機械学習モデルの開発者が、よりモデルの開発にのみ集中できるようにすることを目指して開発している「LakeTahoe(レイクタホ)」について紹介します。

MLOpsの「壁」を乗り越える、LINEヤフーの Data Quality as Code

AIプラットフォームにおいてMLOpsの構造的課題にたいするアプローチとして提供した Data Quality as Code についてご紹介します。

Yahoo! JAPANのデータパイプラインで起きた障害とチューニング - Apache Kafka Meetup Japan #5

データ収集基盤として採用している Apache Kafka を運用してい発生した障害と、それにたいしてどのような対処をしたのかをご紹介します。

Flink@Data Platform - Ingestion Pipeline Redesign and Auto-scaling

データ収集基盤を Apache Flink を使って再構築した話を、どのような課題があってどのようなチャレンジをしたのかについてご紹介します。

Adopting Apache Iceberg on LINE Data Platform

取り扱うデータが大きくなるにつれて様々な問題が出てきたのに対して、テーブルフォーマットを Hive Table から Apache Iceberg を採用した話をご紹介します。

Introducing a Unified, Managed Workflow Service for LINE Data Platform

たくさんのETLワークロードをDataPlatformが提供する標準化された方法で、利用者はコードを書くことなく利用できるようにするために Apache Airflow をベースに開発した Managed Workflow Service についてご紹介します。

採用情報公式SNSアカウント

各SNSでも採用に関する情報を発信しています。

  • X
  • LinkedIn
  • Facebook
  • note
Page top