NetSpeedが機械学習テクノロジを活用して自動車向けICのエンドツーエンドQoSソリューションを実現

  • By Mitch Heins
  • 24th 12 2016
Article: iPhone5 Versus Samsung S3: the Key Question-netspeed-jpg

数週間前、私は自動運転自動車での機械学習テクノロジとディープニューラルネットワークの利用に関する記事を書きました。最近、機械学習テクノロジは、自動車IC市場向けの高度なエンドツーエンドQoS(クオリティオブサービス)ソリューション作成の支援にも応用されていることを知りました。自動運転自動車の登場により、自動車は、受け取るデータストリームすべてを処理できなければならないという要件が新たに加わりました。多くの自動車システム設計者たちが、性能の向上、消費電力の低減、およびシステム全体の信頼性向上という要件を満たすために、異種マルチコアSoC(システムオンチップ)に注目しています。

これらの新しいSoCは、一般的な同種マルチコアICではありません。むしろ、さまざまな計算エンジンを搭載した異種SoCであり、エンジンごとにQoSがかなり異なっています。自動車用SoCには、具体的にはCPUクラスタ、GPU、通信コア(Wi-Fi、Blue-tooth、USB、4Gモデムなど)、マルチメディアコア、GPS、DSP、カメラ、ジェスチャー処理、ディスプレイ/ビデオ、セキュリティモジュールなどが含まれます。

Article: iPhone5 Versus Samsung S3: the Key Question-qos-jpg

これらの先進の異種アーキテクチャには、多くの課題が伴います。コアが異なれば、動的で多様な負荷とさまざまなQoS要件に対応し、メモリを共有し互いに対話しなければならず、複雑さが増すことになります。さらに、消費電力量を低く抑えたままにするには、SoCがさまざまな負荷とQoS要件に適応するのに応じて、「その場で構成できる」という特徴も望ましいでしょう。

自動運転自動車に搭載された多くのアプリケーションは、高性能コンピューティングも要求されます。これは、ハードウェアレベルで、複数のコアとモジュールでキャッシュコヒーレンシが必要になることを意味します。データとアーキテクチャが同種の場合でも、コヒーレントなシステムを設計するのはかなり大変なのに、これらの新しい自動車用SoCでは、データとアーキテクチャが異種であるため、なおさら困難です。さらに、これらのアプリケーションは、自動車内部で実行されるものであるため、非常に堅牢で、セキュアかつ耐故障性でなければなりません。これはつまり、設計者がシステム(ソフトウェアとハードウェア)をアプリケーションレベルでデッドロックフリーになるように設計しなければならないことを意味します。

従来、システム設計者たちは、独自のバスまたはオンチップ通信ファブリックを作成してきました。しかし、マルチベンダIPの使用に伴い、これは難しくなってきています。速度、レイテンシ、I/O、およびQoS要件がそれぞれ異なっているためです。場合によっては、システムアーキテクチャ設計者たちは、これらの違いが原因で生じるボトルネックを回避するために、多重ネットワークまたは分離サブネットワークに注目してきました。

それでは、機械学習テクノロジは、求められるQoSソリューションとどのような関係があるのでしょうか?ここで、NetSpeed Systemsの出番です。NetSpeedでは、ネットワークオンチップ(NoC)合成機能を提供しています。このツールセットでは、機械学習アルゴリズムを使って、さまざまな負荷とQoS要件に対応できるようにコアとモジュールをユーザ独自に組み合わせた定義に沿うようにチューニングされたNoCの合成と最適化を行います。機械学習の主なメリットの1つとして、システムと人間の相互作用を考慮し、それがQoSにどのように影響するかを理解したうえで、システム全体をモデリングできるようになることが挙げられます。NetSpeedの機械学習テクノロジは、さまざまな使用モデルで幅広く性能と電力効率を最適化するように設計してあります。このアプローチの利点は、搭載ソフトウェア側でマルチドロップバス、リング、ツリー、メッシュなどのさまざまなネットワークトポロジの中から選んで、新しいハイブリッドネットワークアーキテクチャを自由に構築できることです。
Article: iPhone5 Versus Samsung S3: the Key Question-noc-architectures-jpg

あるいは、システム設計者が特定のトポロジを指定して、ツールの選択肢をオーバーライドすることもできます。人間の設計者ももちろん優れていますが、自動化された高速機械学習アルゴリズムで強化されれば、鬼に金棒です。合成されたネットワークの一般的なバンド幅性能と、機械学習アルゴリズムの助けを借りずに手作業でチューニングされたネットワークを比較した図をご覧ください。

NetSpeedのNocStudioソフトウェアには、はるかに大規模なネットワークの設計から学んだ経験を取り込んであり、それらがチップレベルの問題に適用されています。他のネットワークと同様に、ネットワークオンチップでも、チップ上の1箇所から別の箇所に所定の時間内にその他の信号を遅延させることなく流れる、という信号のQoSを確保しなければなりません。NetSpeedのNoCは主にARMベースのSoCを対象にしているため、AMBAおよびAXIプロトコルをサポートするIPブロックに直接つながります。現在、NetSpeedは、AMBA 5までのプロトコルをサポートしますが、その他のプロトコル用のガスケットを作成することもできます。ネットワークレベルでは、NetSpeedはすべてのトラフィックを「NetSpeed Streaming Interface Protocol(NSIP)」と呼ばれるネイティブフォーマットに変換します。
Article: iPhone5 Versus Samsung S3: the Key Question-nocstudio-jpg

NocStudioは、NetSpeedのOrion(非コヒーレント)またはGemini(コヒーレント)のNoCアーキテクチャを自動的に構成しますが、これは設計者が複数のベンダからのさまざまなコアとモジュールを統合できるようにしたことで実現されました。設計が進むにつれて、NocStudioのシステム性能統計データが更新されていきますが、結果として設計者たちは妥協点を見つけることができます。この統計データには、リンクコスト(インターコネクトに必要な配線数)とバッファコスト(必要なFIFOバッファの実装に必要なフリップフロップ数)が含まれます。また、NocStudioは長い配線にパイプラインステージを自動的に追加して、レイテンシ要件を満たし、QoSを保証することもできます。QoS仕様には、データパスバンド幅、転送レイテンシ、サービス優先順位、速度制限などの要素が含まれることがあります。

最終結果として、フルスケールのNoCを実装する、合成準備が整った1組のRTLコードが得られます。これには、メモリを共有する複数のモジュール間でのキャッシュコヒーレンシを確保するために必要なロジックがすべて含まれます。NetSpeedは、ネットワークロジックを自動合成できるようにするだけでなく、そのソリューションにより、設計者たちがICレイアウトチームのガイドとして使用できる、SoCのフロアプランの最初のイメージをつかむことができます。

次週かそれくらいに、この同じテーマの第2弾を公開し、NocStudioの詳細およびNoCが機能する仕組みと概要について説明します。それまでの間、次もご覧ください:
Gemini 3.0をリリース
NetSpeedが1000万ドルを調達 - SoC設計とアーキテクチャに機械学習を導入

Request A Demo

ajaxloader

Crafted @ Lollypop.biz