[研究会] Evaluating Transformer-Based Embeddings for Software Change Recommendation: From General Models to Specialized Models

小林研M2のSaviraさんが,3月9日から2日間で本学大岡山キャンパスにて開催された情報処理学会ソフトウェア工学研究会第222回研究集会にて研究発表を行いました。この研究はSaviraさんの修士論文の一部をまとめたものです.

著者:Savira Ramadhanty, Profir-Petru Partachi,Takashi Kobayashi(Science Tokyo)
題目:Evaluating Transformer-Based Embeddings for Software Change Recommendation: From General Models to Specialized Models
掲載誌: The SIG Technical Reports of IPSJ, Vol. 2026-SE-222, No. 3, pp.1-8. [Link], Mar. 9, 2026.

概要:
As software evolves, dependencies between program elements become increasingly complex. This complexity often results in incomplete changes, leading to bugs due to the developers’ inability to determine all impacted elements. To address this issue, previous work recommended co-change candidates at commit time. They do so based on a composite similarity over commits using textual information and changed items. However, when calculating the similarity of textual information, the semantics of code changes, which can serve as additional context, are not considered. Our proposed methods incorporate change semantics by deriving them from textual information using code-task pre-trained models. The goal is to allow the recommendation system to capture the overall context and characteristics of changes more accurately than existing methods.

ソフトウェアの進化に伴い,プログラム要素間の依存関係は一層複雑化する.このような複雑性は,開発者が変更の影響範囲を完全に把握できないことに起因して不完全な変更を引き起こし,結果としてバグ発生の主要な要因となる.この問題に対処するため,先行研究ではコミット時に共同変更(co-change)候補を推薦する手法が提案されている.これらの手法は,テキスト情報および変更対象項目に基づくコミット間の複合的な類似度により推薦を行う.しかし,テキスト情報の類似度算出において,追加的な文脈情報となり得るコード変更のセマンティクスが考慮されていないという課題が残されている.
本研究で提案する手法は,コード関連タスクに特化して事前学習されたモデルを用いてテキスト情報から変更セマンティクスを抽出し,これを推薦プロセスに組み込むものである.これにより,既存手法と比較して,変更の全体的な文脈および特徴をより精緻に捉えることを可能とし,共同変更候補推薦の精度向上を実現することを目的とする.