AWS上でのビッグデータプラットフォームのオーケストレーション
Amazon Elastic MapReduceで大量のビジネスデータを活用
要約
市場調査と顧客エンゲージメントは、ビッグデータが企業の事業再定義を支援する上で中心的な役割を果たすことを示しています。
Hadoopはビッグデータ分析に最適なプラットフォームになりつつあります。長年にわたり、何千もの組織がHadoopクラスターと関連するビルディングブロックを使用して、毎日ペタバイトのデータを処理するデータプラットフォームを構築し、実行してきました。組織内にHadoopエコシステムを構築するために必要なすべての課題が生じるにもかかわらず、Hadoopベースのデータプラットフォームはデータランドスケープの不可欠な部分になっています。
Hadoopベースのデータプラットフォームは、クラウド上での実行と管理が何倍も容易になります。クラウドベースの展開により、ユーザーはHadoopクラスターをほぼリアルタイムで、より低コストでスピンアップし、拡張することができます。
TCSはクライアントと提携し、AWSクラウド上でビッグデータシステムのランドスケープを実行することで、拡張、アジリティの向上、革新、新サービスのより迅速な立ち上げを実現します。
AWSはAmazon Elastic MapReduce (EMR) を提供しています。これはHadoopベースのマネージドサービスで、クラスターのスピンアップと実行に必要な一般的なタスクをすべて処理します。
AWS EMRは、Apache Spark、HBase、HCatalog、Hive、Flink Presto、Ganglia、Oozie、Pig、MXNet、Sqoopを含むソフトウェアスタック全体をサポートしています。これらのパッケージはすべてクラスター作成時に自動的にインストールされるため、クラスターのセットアップが大幅に簡素化されます。 AWS EMRにはカスタマイズされたバージョンのHiveがあり、DynamoDBに接続してクエリを実行できます。
Amazon EKSでデータアーキテクチャを構築します。
企業はEKS上でAmazon EMRを実行して、コンテナ化されたデータワークロードを大規模に展開および管理することもできます。これにより、コストの最適化やパフォーマンスの向上など、さらなるメリットがもたらされます。
EKS上のAmazon EMR、TCS独自のデータアーキテクチャフレームワーク、および業界ドメインの専門知識を活用することで、企業はデジタル戦略に沿ったコンテナ化戦略を作成できます。
業界固有のユースケースに合わせて、エンタープライズKubernetes戦略を作成できます。これには、以下が含まれます。
TCSは、AWS EMRサービスでデリバリーエクセレンスを実証し、多くのクライアントがオンプレミスのHadoopからEMRに移行するのを支援してきました。また、オンプレミスからAWS EMRへの移行において、多くの移行フレームワーク、ツール、アクセラレーターを開発してきました。
AWS上のTCSのデータおよび分析サービスは次のことに役立ちます。
グローバルなクライアントのニーズに対応するためのTCSとAWSの強力なパートナーシップ