IT環境のあらゆるコンポーネントがデータを生成します。このデータを使用して、アプリケーションの振る舞いの分析、エラーのトラブルシューティング、傾向の特定、さらには容量計画の将来の負荷予測さえ行えます。
クラウド時代以前は、企業は機械生成データを分析目的でオンプレミスに保存していました。これらの企業は、ハードウェアの購入からインフラストラクチャの保守、分析ソフトウェアのインストールとアップグレード、セキュリティの実装まで、すべてを自前で処理していました。これはコストも時間もかかり、スケーリングも困難でした。
クラウド分析は、この問題に対するソリューションとして登場しました。データのストレージと分析が大幅に低価格化し、規模を問わず企業が利用しやすくなりました。
この記事では、クラウド分析とは何か、各種のクラウド分析、クラウド分析の仕組みについて説明します。また、自社向けにクラウド分析ツールを選択する際に検討が不可欠な基準についても説明します。
クラウド分析とは
クラウド分析とは、次のようなデータ分析オペレーションを包括する総称です。
- 抽出
- 読み込み
- 変換
- 分析
- 可視化
- モデリング
- …その他の高度なワークロード
これらのオペレーションは、パブリックまたはプライベートのクラウドプラットフォームで実施され、実行可能なビジネスインサイトを生成します。
クラウド分析のためのプラットフォーム
クラウド分析を容易にするために使用できるクラウドプラットフォームには、次の3種類があります。
- パブリッククラウド
- プライベートクラウド
- ハイブリッドクラウド
パブリッククラウド
このアプローチでは、データの格納、処理、分析はパブリッククラウドプラットフォームで行われます。パブリッククラウドプラットフォームを使用する場合、アーキテクチャは通常マルチテナントであり、各クライアントのデータを隔離するためのセキュリティコントロールが実装されています。インフラストラクチャ、アプリケーションサービス、高可用性を含むプラットフォームは、クラウドサービスプロバイダーが管理します。企業は需要に応じてサービスをスケーリング、追加、削除できます。
プライベートクラウド
このアプローチでは、データの格納、処理、分析はプライベートクラウドプラットフォームで行われます。関連するインフラストラクチャ、アプリケーションサービス、データセキュリティは企業自身で管理することになります。セキュリティコントロールは、ファイアウォール、多要素認証、物理制御によって実装されます。インフラストラクチャは共有されません。
ハイブリッドクラウド
ハイブリッドクラウドアプローチでは、データはパブリッククラウドとプライベートクラウドの両方に格納されます。機密情報をオンサイトで保持しながら、パブリッククラウドプラットフォームの柔軟性と機能を活用したい企業がよくこのアプローチを採用します。
サービスとしてのソフトウェア (SaaS) クラウド分析は、データウェアハウス、データレイク、AI、機械学習、自然言語処理などの特定のサービスを提供している一部のパブリッククラウドベンダーから利用することもできます。
クラウド分析の仕組み
クラウド分析の低レベルの実装はプラットフォームごとに異なることもありますが、ほとんどのオファリングには、いくつかの不可欠な共通機能が含まれています。
データの取り込み
次のようなさまざまなシステムおよびデバイスログがクラウド分析プログラムに取り込まれます。
- アプリケーションログ
- Webサイトデータ
- ネットワークトラフィック
- インフラストラクチャ監視メトリック
データが、CRMやERPシステムなど、プライベートまたはパブリックにホストされているビジネスアプリケーションに由来する場合もあります。分析プラットフォームは、データの取り込み後、ビジネスロジックおよびルールを適用して、データを解析し、ときには変換します。
データの格納
クラウド分析プラットフォームは、膨大な量のデータを格納し、長期データ保持設備を提供できます。データは次のような各種の媒体に保存されます。
- ディスクボリューム
- オブジェクトストレージ
- データベース
- データウェアハウス
- データレイク
ほとんどのプラットフォームでは、ストレージの動的な追加や削除を行えます。アクセス頻度の低いデータはアーカイブすることもできます。
データのクエリ
ユーザーはクエリを実行して、さまざまなソースからのデータをフィルタリング、結合、並べ替え、グループ化、集計することで、パターンやインサイトを明らかにすることができます。一部のプラットフォームでは、SQLなどの標準クエリ言語を使用します。その他に独自の言語を使用するプラットフォームもあります。
データの分析
クラウド分析ツールを使用すると、あらゆるサイズのデータセットに対して複雑な分析を実行できます。ユーザーは、グラフ、チャート、マップなどを使用してダッシュボードを作成し、データを視覚的に表示できます。トレンドグラフと色分けを使用することで、異常を簡単に発見できます。高度なプラットフォームは、分析を一段引き上げる人工知能機能を提供しています。
適切なクラウド分析プラットフォームの選択
ほとんどのプラットフォームは、前述の不可欠な機能を提供していますが、その他の機能を利用できるかどうかはベンダーごとに異なります。自社のニーズに最も適合するプラットフォームを選択する際は、その他にどのような機能が必要かを特定することが、それを提供しているプラットフォームを見つける鍵になります。
セキュリティ
機密データを扱っている場合は、プラットフォームが提供するセキュリティ機能をしっかりと理解してください。少なくとも、プラットフォームは保存中および転送中のデータを暗号化し、カスタム暗号化キーの使用とキーのローテーションのオプションを提供している必要があります。その他の機能には、組み込みのファイアウォール、アンチウイルス、多要素認証などがあります。業界によっては、企業が従う必要のある規制があるかもしれません。プロバイダーがSOCやISO27001のようなセキュリティ認定を提供していることを確認します。
分析
一部のパブリッククラウドプラットフォームは、高度なAIおよび機械学習機能を提供しており、モデルの構築、トレーニング、展開を行えます。専門的なスキルや社内のデータサイエンティストチームは必要ありません。機能がビジネス目標と一致していることを確認して、不要なものにお金を払わないようにします。
コスト
パブリッククラウドプラットフォームは、オンプレミスのセットアップと比較して大幅にコストを削減できます。ただし、一部の高度な機能に関しては、次のような追加コストが発生することがあります。
- 組み込みのノートブック
- MLサービス
- サーバーレス機能
- マネージドビッグデータクラスター
- APIゲートウェイ
- ハイエンドサーバー
クラウド分析ワークロードに必要なサービスだけを使用していることを確認します。
スケーラビリティ
パブリッククラウドプラットフォームは、ビジネスニーズに合わせてインフラストラクチャをスケーリングするのに役立ちます。優れたクラウド分析プラットフォームは、柔軟な価格設定、無料プラン、アドオン、購入前割引などで、このようなスケーリングにも対応します。
統合
クラウドデータは、他の組織的な情報システムとの統合が必要になることがよくあります。最高のクラウド分析プラットフォームは、主要システムとの統合が組み込まれており、複数のシステムからのデータを簡単に組み合わせることができます。既存のETLツールを使用して、他のプラットフォームからデータを取り込むことができる必要があります。同様に、クラウド分析アプリケーションは、セキュリティ情報およびイベント管理 (SIEM) またはセキュリティのオーケストレーション、自動化と対応 (SORA) プラットフォームでアラートまたはアクションをトリガーできる必要があります。
すべてをログに記録、すべてに対する回答 - 無料
Falcon LogScale Community Edition(旧称Humio)は、クラウド向けの最新のログ管理プラットフォームを無料で提供します。ストリーミングデータ取り込みを活用して、分散システム全体を即座に可視化し、インシデントを防止および解決します。
無料ですぐにご使用可能なFalcon LogScale Community Editionには、次のものが含まれています。
- 1日あたり最大16GBの取り込み
- 7日間の保持期間
- クレジットカードは不要です
- トライアル期間なしの継続的なアクセス
- インデックスフリーのログ記録、リアルタイムのアラート、ライブダッシュボード
- 新しいパッケージをビルドするためのガイドを含む、マーケットプレイスとパッケージへのアクセス
- アクティブコミュニティの情報とコラボレーション