GMOインターネットグループ株式会社/東京/正社員/機械学習エンジニア

東京都
正社員
リモート
大手企業
上場企業
自社製品・サービス
海外展開あり
外国籍社員多い
Company Image
業種
大手インターネット関連サービス事業会社
開発言語
Java, Pandas, Python, Numpy
勤務時間
固定労働時間制
年収
600万円〜1,000万円
仕事内容
グループ研究開発本部は、GMOインターネットグループの事業領域で力を入れているスタートアップやグループ横断のプロジェクトにおいて、技術支援・開発・解析などを行い、ビジネスの成功を支援する部署です。 その中にAI研究開発室があり、データ解析やAIに関する支援を行っています。また、最新のテクノロジーを常に研究開発し、いち早くビジネスに投入し結果に繋げます。 以下のいずれかにまず参加して頂きます。その後さらに専門性を高めて頂くか、もしくは他のプロジェクトに参加して、実績に応じて希望のキャリアを積んで頂きます。 ◆フィンテック(Fintech)のプロジェクト GMOインターネットグループが展開する金融サービスの本質を理解し、数理モデルや機械学習などのデータサイエンス技術を駆使しながら、予測が難しい金融データをうまく扱って収益を改善させます ◆アドテク(Adtech)のプロジェクト インターネット広告の主な仕組みの一つであるRTB(リアルタイム入札)において、広告出稿する側の費用対効果を最適化するDSP(Demand-Side Platform)の機械学習モデルの設計開発、効果測定などをメインに行います ◆アプリのプロジェクト フリーWiFi接続を容易にするアプリの新機能や施策の効果測定を因果推論の技術を駆使して行い、データドリブンに経営判断するための仕組みを整えて、サービスのKPIを改善させます ◆その他のプロジェクト 暗号資産取引、不正検知などに関して、データ解析や機械学習の技術を応用して支援します 【研究開発業務】 ・プロジェクト業務を行いながら、一定の時間、全員で最先端の機械学習手法や新たな機械学習の応用を研究します ・さらに四半期ごとに選任されたメンバーは重点的に研究開発を行います 【ポジションの魅力】 GMOインターネットグループの多岐に渡るサービスについて、データ解析およびAI技術によって様々な課題を解決するプロジェクトをゼロから立ち上げる機会があります 世界 No.1 規模の金融データや、数百テラバイト規模のアドテクデータなど様々な領域のデータを直接扱うことができ、ビッグデータを解析する技術(BigQuery・PySparkなど)も習得できます 時系列データ、ユーザー行動データ、記事といった様々な種類のデータを解析することができます 担当するプロジェクトのビジネス領域や、最先端の機械学習・深層学習・統計手法などを常に学べます 重要な3つのスキル(ビジネス課題解決・データサイエンス・エンジニアリング)を身につけ、一つ以上強みを大きく伸ばせます 別のプロジェクトを担当する部署のデータサイエンティストと勉強会などで交流する機会も多く、データサイエンススキルを高められます グループ研究開発本部配下のエンジニア精鋭部隊である次世代システム研究室のメンバーと一緒に業務することが多く、エンジニアリングスキルが伸ばせます グループCTO直轄の部署であり、技術の選定は現場に一任されているため、最先端の技術を自ら検証・導入することができます 全て自社サービスのため、事業部と一緒に自ら課題を設定し解決方法を考え、データサイエンスに基づいた改善サイクルを行うことができます 本人の実績と意欲に応じて、チームの重点テーマについて自由に研究開発する業務に挑戦することができます アカデミックな分野で活躍してきた博士やエンジニア出身者などでチームが構成され、多様性のあるチームです 【利用技術】 ◆解析手法 機械学習: Transformer系(大規模言語モデル他)、グラフニューラルネットワーク(GNN)、多層パーセプトロン(MLP)、アンサンブル学習/勾配ブースティング(Gradient Boost Tree + LR, Random Forest, ExtraTree , Ada Boost, XGBoost, LightGBM)、PCA、FP-Growth、Word2Vec、Doc2Vec、協調フィルタリング、ベイズ推定、HMMモデル(隠れマルコフモデル) 統計分析: t検定、カイ二乗検定、F検定、二項検定、コルモゴロフ・スミルノフ検定、シャピロウィルク検定、サンプリング(MCMC,ブートストラップ法など)、分散分析、因果推論(差分の差分法など) ◆開発技術/環境 プログラミング/フレームワーク Python、PyData(numpy、scipy、pandasなど)、Streamlit PyTorch、TensorFlow、LangChain、Spark(PySpark) クラウド/オンプレ(ミドルウェア) Google Cloud(GCS、BigQuery、VertexAI、Dataflowなど) AWS(S3、Athena、EMR/Serverless、StepFunction、SageMaker、Bedrockなど) MySQL、MariaDB、Percona Server、PostgreSQL、Galera Cluster、Oracle、Hive、Hadoop/HDFS ConoHa(GPUサーバー) 大規模言語モデル(LLM)関連 OpenAI API、Llama3、LangChain、HuggingFace ◆開発ツール Atlassian(Jira、Confluence)、Trello VS Code、PyCharm、Jupyter GitHub(Copilot) Tableau、Looker Studio、metabase ChatGPT、Gemini、Claude ◆開発手法 アジャイル開発(scrumベース)
求められるスキル
【必須スキル/経験】 以下の条件をすべて満たしている方 ・実際にプロダクトもしくは研究で機械学習/深層学習を活用して実績を出した経験がある ・機械学習モデルを実業務で実装し本番運用した経験がある ・システム開発におけるテストをきちんと行える ・Pythonが書けて、オブジェクト指向がわかる ・一通りの機械学習・深層学習の知識がある 【歓迎スキル/経験】 ・博士号を取得している ・「確率論・統計学」の基礎が身についている 【活躍できる人物像】 ・手法ありきではなく、ビジネス課題解決のためにあらゆるアプローチを考えて最適なやり方を見出すことが好きな方 ・どんなことにも興味をもち、情熱をもって新しい技術、新しい業務にチャレンジできる方 ・一人では到底できない大きな成果をチームで目指せる方 ・データや結果を鵜呑みにしないで、常にクリティカルシンキングを行える方
求められる語学能力
日本語力
ビジネスレベル
英語力
ビジネスレベル
その他語学スキル
Banner Background

今すぐサポートを申し込む

まずは相談だけでもOK!お気軽にご登録ください