一般社団法人データサイエンティスト協会

データサイエンティスト検定™ リテラシーレベル

データサイエンティスト検定™ リテラシーレベルとは?

『データサイエンティスト検定™ リテラシーレベル』(略称:DS検定™ ★)とは、アシスタント・データサイエンティスト(見習いレベル:★)と数理・データサイエンス教育強化拠点コンソーシアムが公開している数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムを総合し、実務能力と知識を有することを証明する試験です。

※データサイエンティスト協会プレスリリース (2014.12.10)

データサイエンティスト協会ではデータサイエンティストに必要なスキルや知識をスキルチェックリストタスクリストという形で定義し、高度IT人材の育成と業界の健全な発展への貢献、啓発活動を行ってきました。内閣府が策定した「AI戦略2019」においても、デジタル時代の人材育成や教育改革は国全体の重要な課題となっています。本検定の取得により、データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力についてそれぞれ見習いレベルの実務能力や知識、また、数理・データサイエンス・AI教育のリテラシーレベルの実力を有していることを証明することができます。 データサイエンティストを目指す人達とそれを必要とする産業界を結びつける一つの指針となることを目指しています。

検定の対象

本検定の受験対象者は以下のような方を想定しています。
・データサイエンティスト初学者
・これからデータサイエンティストを目指すビジネスパーソン
・データサイエンティストに興味を持つ大学生や専門学校生など

検定概要(予定)

受験資格なし
実施概要選択式問題
全国の試験会場で開催(CBT)
問題数80問程度
試験時間90分
出題範囲スキルチェックリストの3カテゴリ(データサイエンス力、データエンジニアリング力、ビジネス力)の★1(見習いレベル)相当と数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムを総合した範囲
※詳細は「データサイエンティスト検定™の試験範囲(予定)を参照
公式テキスト2021年7月頃出版予定
試験時期年2回(春、秋)の試験期間を予定。第1回は2021年9月頃を予定
申し込み2021年7月申し込みサイトオープン予定
受験費用
(税抜)
一般10,000円
学生5,000円

データサイエンティスト検定™の試験範囲(予定)

データサイエンス力★1

統計数理基礎、線形代数基礎、微分・積分基礎、回帰/分類、評価、検定/判断、グルーピング、性質・関係性の把握、サンプリング、データクレンジング、データ加工、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、アプローチ設計、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、機械学習、時系列分析、言語処理、画像処理、動画処理、音声/音楽処理、パターン発見

データエンジニアリング力★1

システム運用、システム企画、クライアント技術、通信技術、基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、クレンジング処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、データインタフェース、分析プログラム、SQL、基礎知識、攻撃と防御手法、暗号化技術

ビジネス力★1

ビジネスマインド、データ倫理、コンプライアンス、契約、MECE、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、KPI、スコーピング、データ入手、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント

リテラシーレベル:モデルカリキュラム<スキルセット>

1.社会におけるデータ・AI利活用

1-1.社会で起きている変化・ビッグデータ、IoT、AI、ロボット
・データ量の増加、計算機の処理性能の向上、AIの非連続的進化
・第4次産業革命、Society 5.0、データ駆動型社会
1-2.社会で活用されているデータ・調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
・1次データ、2次データ、データのメタ化
・構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
・データ作成(ビッグデータとアノテーション)
・データのオープン化(オープンデータ)
1-3.データ・AIの活用領域・データ・AI活用領域の広がり(生産、消費、文化活動など)
・研究開発、調達、製造、物流、販売、マーケティング、サービスなど
・仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
1-4.データ・AI利活用のための技術・データ解析:予測、グルーピング
・データ可視化:関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など
・非構造化データ処理:言語処理
1-5.データ・AI利活用の現場・流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介

2.データリテラシー

2-1.データを読む・データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
・観測データに含まれる誤差の扱い
・相関と因果(相関係数、擬似相関、交絡)
・母集団と標本抽出(国勢調査、アンケート調査、全数調査、単純無作為抽出、層別抽出、多段抽出)
・統計情報の正しい理解(誇張表現に惑わされない)
2-2.データを説明する・データの図表表現(チャート化)
・データの比較(条件をそろえた比較、処理の前後での比較、A/Bテスト)
・不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)
・優れた可視化事例の紹介(可視化することによって新たな気づきがあった事例など)
2-3.データを扱う・データの集計(和、平均)

3.データ・AI利活用における留意事項

3-1.データ・AIを扱う上での留意事項・個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト

※2020年4月数理・データサイエンス教育強化拠点コンソーシアム「数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム~データ思考の涵養~」より抜粋

今後のご案内について

本検定のご案内をご希望の方は、以下いずれかの方法でご登録願います。
最新情報をメールにてお送りさせていただきます。

当協会からの各種案内(主催イベントや法人会員からの案内など)

一般(個人)会員登録 ※登録は無料です

本検定のみのご案内

以下メールアドレスまで空メールをお送りください

 

ページトップへ

入会のご案内

会員一覧

求人情報

DSS Journal

最新情報をつぶやいています