エンタプライズデータ
データを有効活用し、新しいビジネスを生み出す
データの運用管理、移行、データ分析基盤を構築する。そして、データの活用を通してビジネス変革に取り組む。 AI技術を導入など、新しいビジネスを生み出すために必要なデータの活用方法。
データウエアハウス
MPP アーキテクチャによって、より大規模なデータ処理が可能なシステム
データレイク
規模にかかわらず、すべてのデータを一元化された 1 つのリポジトリに保存
RDB
主に、構造化されたトランザクションデータの保存、処理
NoSQL(ドキュメントDB)
主に非構造化されたトランザクションデータの保存、処理
ドキュメントファイル
ファイルにインデックスを付与し、検索可能な方式で保存
データガバナンス
データに機密レベルを定義し、アクセス制御を可能にする
データウェアハウス(DWH)
データウェアハウス(DWH)はこれまで、意思決定支援やビジネスインテリジェンス(BI)アプリ ケーションにおいて広く利用されてきており、これには長い歴史があります。データウェアハウス の技術は、1980 年代後半の登場以来進化を続け、MPP アーキテクチャによって、より大規模な データ処理が可能なシステムがもたらされました。
しかし、データウェアハウスには、構造化データの処理には適しているが、非構造化・半構造化 データの処理には適していないという問題があり、近代ビジネスが必要とする高速で多様なデータ の大規模処理においては課題がありました。データウェアハウスは、そういった最新のデータ処理 を前提としたユースケースには適しておらず、コスト効率的にも最適なソリューションではありま せん。
データレイク
データレイクは、規模にかかわらず、すべての構造化データと非構造化データを保存できる一元化されたリポジトリである。 データをそのままの形で保存できるため、データを構造化しておく必要がない。 また、ダッシュボードや可視化、ビッグデータ処理、リアルタイム分析、機械学習など、さまざまなタイプの分析を実行し、 的確な意思決定に役立てることができる。
データからビジネス価値を生み出すことができる企業は、同業他社よりも優れた業績を上げることがで着る。 JDAIの調査によると、データレイクを実装した企業は、同業他社と比べて本業の収益成長が 9% 上回っている。 このようなトップ企業は、ログファイルのほか、クリックストリーム、ソーシャルメディア、インターネットに接続した デバイスからのデータなど、データレイクに保存されている新しい情報源に対して、機械学習などの新しいタイプの分析 を実行している。これにより、顧客の獲得と維持、生産性の飛躍的向上、デバイスの事前の保守管理、情報に基づいた 意思決定が可能になり、ビジネスの成長を促進する機会を特定して行動できる。
データレイクは、データの格納には適していたが、トランザクションのサポート やデータ品質の保証といった重要な機能が欠けていた。一貫性と分離性の欠如により、 アペンドと読み取り、バッチとストリーミングジョブを混在させることは課題となる。
データの移動
リアルタイムで送信されるデータをいくらでもインポートできる。 データは複数の情報源から収集され、元の形式のままデータレイクに移動される。 このプロセスによりデータを任意のサイズにスケールできるようになり、 データ構造、スキーマ、変換を定義する作業をなくすことができる。
データの解析
データサイエンティスト、データ開発者、ビジネスアナリストなど、企業内のさまざまな職務を担当する ユーザーが、任意の分析ツールやフレームワークを使ってデータにアクセスできる。 これには、Hadoop、Presto、およびSpark などのソースフレームワークで直接データ解析ができる。
セキュアな保存
RDB と 非RDBのデータを保存することができる。 また、データのクローリング、カタログ化、インデックス作成によって、どのデータが保存されているかを把握する機能も提供している。 さらに、データアセットを保護するためにデータはセキュアである。
機械学習
履歴データのレポートを作成することや、結果予測モデルを構築する際に機械学習を実施することなどにより、 さまざまなタイプのインサイトを生成し、最適な結果を得るための所定のアクションとして幅広い選択肢を提示することができる。