Masaki Aota

Machine Learning Engineer
& Data Scientist

Kaggle Master | AtCoder水色

Masaki Aota

自己紹介

早稲田大学大学院卒業後、2021年より大手メディア企業で機械学習エンジニア・データサイエンティストとして活動しています。 生存分析、ABテスト、画像処理、自然言語処理など幅広い分野での業務経験があります。

研究開発部署ではPoCに従事し、新機能の実装や年間数千万円規模のコスト削減を達成。 現在はB2B事業部署で、自然言語処理を活用したシステム開発に携わっています。

プログラミング言語

  • • Python
  • • SQL

※ 業務に必要な言語はキャッチアップします。

クラウドプラットフォーム

  • • Google Cloud
    • - Professional Data Engineer
  • • Amazon Web Services
    • - Solutions Architect Associate

機械学習フレームワーク

  • • PyTorch/Transformers
  • • Scikit-learn
  • • OpenCV
  • • Ultralytics
  • • vLLM
  • • Streamlit/Gradio

データ処理ライブラリ

  • • Pandas/Polars
  • • NumPy
  • • Matplotlib
  • • Jupyter
  • • wandb

プロジェクト

サブスク事業の価値計算

生存分析や金融工学の手法を用いて事業価値を統計的・金融工学的に妥当な手法で算出。

PythonSQL生存分析Dashboard

ドメイン特化OCR機能開発

自社データに特化した高精度OCRエンジンを開発。プロダクションレベルのコード整備と高速化を実現。

PythonCythonOpenCVCircleCI

画像圧縮最適化

画質を維持した圧縮率の最適化により年間数千万円規模のクラウド利用料削減を実現。

AWS LambdaPythonwandb画像処理

Deep Learning画像最適化

深層学習による画像処理でコスト削減可能性を実証。デモ用iOSアプリを作成し、ユーザー体験を損なわないことも検証。

PyTorchONNXiOS

画像データ前処理自動化

自社データに特化した深層学習モデルを作成。既製品より精度の高い前処理パイプラインを構築し、後段処理における人件費を削減。

TransformersUltralyticsLabel Studio

言語処理基盤の構築

自社の言語処理基盤を構築中。大規模言語モデルを活用したシステム開発に従事。

PythonTransformersLLM

AIコーディング文化の布教

自社チームにAIコーディング文化を布教。ちなみにこのサイトは100%自然言語指示によるAIコーディングで作成されている。

CursorGitHub CopilotClaude Code

政治資金収支報告書の情報抽出

OCRやLLMを活用した政治資金収支報告書からの情報抽出システムを開発。学会発表・論文投稿を実施
OCRLLMLabel Studio

自社プロダクト掲載の広告分析

広告の滞在率に影響する要素を分析、広告関係者へ知見を共有。

PythonLabel StudioGoogle Cloud Vision API

データ分析コンペティション

Kaggleを中心とした機械学習コンペティションで複数回入賞。深層学習を用いた自然言語・画像処理分野で実績。
PythonTransformerswandb

競技プログラミング

半数以上のIT企業において、アルゴリズム能力についてはカンストと言える実力。AtCoder Algorithm: 水色 (最高: 1356)。Heuristicへ参加するタイミングを伺っている。

PythonCythonNumPyPyPy

私が登場する出版物

謝辞掲載

「PolarsとPandasで学ぶ データ処理アイデアレシピ55」

著者: 冨山 吉孝、早川 裕橹、齋藤 慎一朗

本書の謝辞に掲載いただきました。データ処理に関する知見の共有や技術的なフィードバックを行いました。

インタビュー掲載

「目指せメダリスト!Kaggle実験管理術 着実にコンペで成果を出すためのノウハウ」

著者: 髙橋 正憲、篠田 裕之
協力: 坂本 龍士郎

Kaggleでの実験管理に関するインタビューが掲載されました。効率的な実験管理手法について語っています。

ブログ引用

「機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック」

著者: 森下 光之助

執筆したブログ記事が本書で引用されました。機械学習モデルの解釈性に関する技術的な考察が参考文献として取り上げられています。

お問い合わせ