怎样才能减少软件中的Bug？数据显示程序员才是制造 Bug 的“元凶”

发布时间：2019-04-29 23:52:41 所属栏目：优化来源：弯月编译

导读：代码的 Bug 到底与什么有关？代码的行数？项目的规模？还是开发者的人数？在本文中，将基于机器学习模型绘制的图形，告诉你诸多 Bug 的由来！以下为译文：怎样才能减少软件中的Bug？本文将告诉你传统观点是错误的，下列数据会让你感到惊讶。软件开发人

由于PR数和给星数是GitHub特有的功能，我还构建了一个没有这两个数据项的模型。然后，根据拟合模型的系数，再进一步将其简化为只包含提交代码的人数和提交次数。这种只有3个变量的模型的表现几乎与其他模型完全相同，而且还可以显示成3G图形：

ln(issues) = β1first commit age + β2ln(contributors) + β3ln(all commits) + β4ln(code) + β5ln(comments + 1) + β6ln(files) + ε

ln(issues) = β1ln(contributors) + β2ln(all commits) + ε

在删除了GitHub特有的数据项后，提交代码的人数和提交次数就占据了主导地位，从删除所有其他变量时错误数轻微的减少就可以看出。

会不会是这个模型搞错了？

现在我们知道了提交代码的人数和提交次数的影响，下面我们来看看，如果不采用任何根据提交代码的人数和提交次数绘制图形的模型，那么代码行数与问题数量之间有何关系。

针对GitHub上最受欢迎的项目，绘制代码行数（x轴）与GitHub上的问题数（y轴）的关系图，并根据提交代码的人数和提交次数分组。

为了节省空间，我没有显示所有的10万个顶级项目。我按照提交代码的人数和提交次数进行了分组，因为我觉得这种分组方式最有意思，且最具代表性。为了避免选择偏差，我只在选择分组之后进行绘图。

（编辑：东莞站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

SEO人员经常难以回答	怎样用页面组合批量排
盘查几个无须手动的S	企业站排名必定有关