ワークフローモデルの構築によるAI推論フローの処理割当て手法の提案
ソフトウェア品質管理研究会 研究コース5「人工知能とソフトウェア品質」(2022年)
執筆者:
伊藤 弘毅(三菱電機株式会社)主査:
石川 冬樹
エッジデバイスの計算リソースの増大に伴い,AIの推論処理をクラウド上ではなくエッジ側で実行するエッジAIを実現できるようになり,AIをIoTシステムに搭載する際の設計の選択肢が広がっている.AIの推論処理を適切にクラウド側とエッジ側に割当てない場合,処理性能が想定を下回ったり,高額なクラウド課金が発生するなど,要求品質を満たさない可能性がある.決定した処理割当て方法が要求品質を満たすか検証する必要があるが,実機を用いて検証する場合,検証用ソフトウェアの開発やシステムの環境構築に工数を要する.本論文では,AIの推論処理および付随する前処理と後処理の実行時間と通信量を表現するワークフローモデルを構築することにより,処理割当てのパターンごとに全体の処理時間や課金額を推測し,最適なパターンを開発者に提示する手法を提案する.また,推測結果と実機の実測結果を比較することにより,提案手法の精度と制約について論ずる.