コードレビュー分析におけるデータクレンジングの影響調査

戸田 航史, 亀井 靖高, 吉田 則裕

研究成果: ジャーナルへの寄稿学術誌査読

抄録

In this paper, we investigate the effect of data cleansing techniques for code review analysis. We choose three open source software projects, Android, Chromium and OpenStack, then collect code review data from them. We perform two data cleansing techniques to the dataset. 1. remove bots from reviewers. 2. Correct review start and end time for reviewing time calculation. Then, we compare cleaning data and not cleaning data about each cleansing techniques and evaluate their effect. The results show both cleansing techniques effect to code review analysis, because 1. bots accounts for 19.4% in OpenStack review. 2. corrected reviewing time is significantly different from not corrected one. Additionally, we investigate a change of correlation coefficient of reviewers' experience and the reviewing time by performing both data cleansing techniques. The result shows cleansing to reviewers effect to the correlation.
寄稿の翻訳タイトルInvestigating the Effect of Data Cleaning Techniques for Code Review Analysis
本文言語日本語
ページ(範囲)845-854
ページ数10
ジャーナル情報処理学会論文誌
58
4
出版ステータス出版済み - 4月 15 2017

フィンガープリント

「コードレビュー分析におけるデータクレンジングの影響調査」の研究トピックを掘り下げます。これらがまとまってユニークなフィンガープリントを構成します。

引用スタイル