ロングテイルな分布の入力を扱う機械学習システムに対するテスト設計手法の提案
ソフトウェア品質管理研究会 研究コース5「人工知能とソフトウェア品質」(2022年)
主査:
石川 冬樹
本研究では,機械学習のデータセットによくみられる,大量のレアケースを含むロングテイルな分布において,機械学習の外部品質特性であるAIパフォーマンスとリスク回避性を両立した品質評価手法について提案する.機械学習システムにおいて,複数の品質特性が挙げられるが,これらは必ずしも両立するものではなく,時には相反する特性となることもある.AI-OCRを題材とし,文字の使用頻度に着目してこれら2つの品質特性のバランスを考慮して評価する方法とその効果,また,そのときのテスト削減効果が十分有効であったため,その内容について報告する.