ワークフローモデルの構築によるAI推論フローの処理割当て手法の提案
ソフトウェア品質シンポジウム2023 2022年度SQiP研究会 研究コース5「人工知能とソフトウェア品質」(2023年)
執筆者:
伊藤 弘毅 (三菱電機(株))主査:
石川 冬樹(国立情報学研究所)
クラウドやエッジデバイスなど複数の装置でAIの推論フロー(前処理・推論処理・後処理)を実現する場合、どの処理をどの装置に配置するか割当てを決める必要がある。その時に、十分に検討せずに割当てを決めると、各処理の実行時間や処理間のデータ通信量といった性能効率性や、クラウドサービス利用による課金額が要求を満足せず、設計や実装の手戻りが発生する可能性がある。この手戻りを防ぐには、実機でシステムを構築する前に、上記の非機能要求を検証することが必要となる。
そこで、本発表ではAIの推論フローを表現するワークフローモデルを利用することにより、フローを構成する処理を各装置に最適に割当てる方法を紹介する。この手法を用いることで、AIの推論フローをシステム上に実現した時の処理時間やリソース消費量を実機なしに推測し、最適な処理割当て方法を効率的に導き出すことができるようになる。
なお、本発表は'22年度SQiP研究会 研究コース5 AI Quality Operationチームの成果報告会での内容に、他の推論フローに対する追加実験を行った結果を加えて発表する。
そこで、本発表ではAIの推論フローを表現するワークフローモデルを利用することにより、フローを構成する処理を各装置に最適に割当てる方法を紹介する。この手法を用いることで、AIの推論フローをシステム上に実現した時の処理時間やリソース消費量を実機なしに推測し、最適な処理割当て方法を効率的に導き出すことができるようになる。
なお、本発表は'22年度SQiP研究会 研究コース5 AI Quality Operationチームの成果報告会での内容に、他の推論フローに対する追加実験を行った結果を加えて発表する。