在软件开发过程中，仅仅缩短编码时间、测试、调试时间，并不能保证项目能快速完成。相反，这三个阶段是息息相关的，它们的质量和效率是影响整个项目周期的关键因素。如果只注重编码的速度，或者只注重测试、调试的进度，则项目完成的时间将会很长。

最近，一位资深工程师分享了如何减少编码、测试和调试阶段中的bug。

一、会导致难点bug的问题

1.事件顺序

处理事件时，需要考虑以下问题：事件的到达顺序是否可以改变?如果我们未及时接收到事件会发生什么？如果某事件连续发生两次会有什么影响？即使通常不会发生，但系统（或与系统交互的其他部分）中存在的bug可能会导致事件发生。

2.过早

这是“事件顺序”中的一个特例，但它确实会导致一些难点的bug，因此需要单独强调。例如，如果在配置和启动程序完成之前接收到信令消息，则可能会发生很多奇怪的问题。另一个例子是，在连接放入空闲列表之前就将其标记为断开连接。在调试此类问题时，我们通常假设连接在空闲列表中时被标记为断开连接（但当时为什么不将其从列表中移除呢？）。这表明我们缺乏思考，没有考虑到有时事情会提前发生。

3.悄无声息的故障

一些最难跟踪的bug有部分是由那些静静失败并扩展而不是抛出错误的代码所导致的。例如，没有检查代码却返回错误的系统调用（如bind）。又如：解析代码在它遇到错误元素的时候只是返回而非抛出错误。在错误状态中持续了一段时间的调用，会使调试变得更难。最好一旦检测到故障就返回错误。

4.if

有若干条件的if语句，if (a 或 b) ，特别是当有链接的时候， if (x) else if (y)，都给我引发了很多bug。即使if语句在概念上很简单，但当有多个条件要跟踪的时候依然很容易出错。这些天，我尝试重写代码使之更简单，以避免处理复杂的if语句。

5.else

有一些bug是因为没有正确考虑到如果条件为false时会发生什么而引起的。几乎在所有的情况下，都应该有一个else部分来应对每一条if语句。此外，如果你在if语句的分支中设置变量，那么或许你在另一个分支中也要设置。与此种情况相关的是标记被设置的情况。只添加用于设置的标记的条件不难，但是很容易忘了添加当标记应该再次重置时的条件。留下一个永远设置的标志可能会导致之后接连不断的bug。

6.改变假设

许多一开始最难预防的bug是因为改变了假设所造成的。例如，在开始时，可能每天只有一个客户事件。于是很多代码是在这样的假设下写下的。但是后来，设计改变了，允许每天有多个客户事件了。发生这种情况时，很难改变新设计影响到的所有情况。找到关于改变的所有显式依赖关系不难，难的是要找到所有隐性依赖于旧的设计的情况。例如，可能会有获取给定某一天所有客户事件的代码。其中的隐含假设是结果集永远不会超过客户的数量。关于这方面的问题我也没有很好的策略方法，如果各位有的话，还请不吝赐教。

7.日志记录

可视化程序做什么至关重要，特别是当逻辑很复杂的时候。确保补充足够多的（但不要太多）日志记录，这样你就可以说明为什么程序要这么做。如果一切正常，那也没关系，但要是有问题发生，你会很庆幸自己添加了这些日志。

二、测试

作为一个开发人员，直到要测试了我才会去处理功能。至少，这意味着每一行新的或改变了的代码行至少已经被执行过一次。此外，单元测试和功能测试都很不错，但还不够。新的功能也必须进行测试，并在类似于产品的环境中探索。只有这样，我才能说我完成了一个功能。下面是我经历过的bug所教会我的关于测试的一些重要的经验教训：

1.零和null

如果可行的话，确保总是用零和null来测试。对于字符串，这意味着要测试长度为零的字符串以及字符串为null两种情况。又如：测试TCP连接的断开，要在发送数据给它发送之前。不使用这些组合方法测试是导致bug出现的首位原因。

2.添加和删除

通常，新的功能包括能够添加新的配置到系统中——例如，一个用于手机号码转换的新的配置文件。测试它能否添加新的配置文件是很自然的。但是，我发现我们很容易忘记去测试删除配置文件是不是同样ok。

3.错误处理

处理错误的代码往往是难以测试的。最好有能检查错误处理代码的自动测试，但有时这是不可能的。我有时会使用的一招是临时修改代码，使得错误处理代码运行起来。要做到这一点最简单的方法是反转if语句——例如，从if error_count > 0改成error_count == 0。另一个例子是拼错数据库列名，从而导致期望的错误处理代码运行。

4.随机输入

通常，揭露bug测试的一种测试方法是使用随机输入。例如，H.323协议的ASN.1解码使用二进制数据操作。通过发送随机字节去解码，我们发现了解码器中的几个bug。另一个例子是用测试呼叫来生成脚本，此时呼叫持续时间，接听延迟，第一方挂断等等都是随机生成的。这些测试脚本会暴露许多bug，特别是一起发生的事件会产生并拢干扰。

5.检查不应该发生的动作

通常测试包括检查期望动作是不是发生了。但我们很容易忽视相反的情况——忘记检查不应该发生的动作是不是的确没有发生。

6.拥有工具

我创建了自己的小工具，以使得测试更加简单。例如，当我用VoIP SIP协议工作时，我写了一个能够用正是我想要的标题和值回复的小脚本。这个工具使得测试很多边界情况变得容易起来。另一个例子是可以进行API调用的一个命令行工具。通过启动逐渐添加所需小功能，我得到了一些非常有用的工具。自己写工具的好处是，我得到的正是我想要的。

在测试中发现所有的bug，那绝对是不可能的。有一个案例中，我更改了数字相关性的处理，数字由两个部分组成：路由地址前缀（通常是不变的），以及从000到999动态分配的数字。问题在于当找到相关性时，动态分配的数字的第一个数字会在呈现在表格中之前遭到误删。也就是说637变成了37。这意味着，到100之前它都是可以工作的，因此，前面100个电话是正常的，但是接下来的900个都是失败。所以，除非我在重新启动之前能够测试超过100次（事实是我没有），否则我在测试时就不会发现这个问题。

三、调试

1.讨论

帮助我最多的调试技术是与同事讨论问题。通常情况下，只是和同事说明问题，就会让我意识到问题的症结。此外，即使他们不是很熟悉有问题的代码，他们也往往能提出一些好点子。与同事讨论在处理最难的bug时特别有效。

2.密切关注

通常，如果调试问题花了很长时间，往往是因为我做了错误的假设。例如，我认为问题发生在某一方法中，但事实却是它甚至从来没有到达那个方法。或者，被抛出的异常不是我以为的那个。或者，我认为软件的最新版本上正在运行，但其实是一个旧版本。因此，一定要核实细节，而不是假设。人们更容易看到自己希望看到的东西，而不是事实。

3.最近的变化

当曾经可以正常工作的东西停止工作，那么这通常是因为最近改变的东西所导致的。在一个案例中，最近的改变只是日志记录，但是日志中的错误却导致了一个更大的问题。为了更容易找到这种回归，承认不同的提交会导致不同的变化，以及清楚说明这些更改会有所裨益。

4.相信用户

有时，当用户报告问题的时候，我的本能反应是，“这是不可能的。一定是他们做错了什么事”。但我学会了不再用这种方式去回应。更多的时间，事实往往证明，他们所报告的的确是实际发生的情况。因此，这些天，我开始接受他们所报告的内容的表明价值。当然，我依然会仔细检查一切是否被正确地设置等等。我见过很多这样的情况，让我明白，因为不寻常的配置或意料之外的用法而导致不可思议的事情的发生，而我默认的假设是，他们是正确的，程序是错误的。

5.测试修复

如果bug修复已准备就绪，那就必须进行测试。首先在修复前运行代码，并观察该bug。然后应用修复并重复测试案例。到此为止错误行为应消失。遵循这些步骤可以确保它确实是一个bug，并且此次修复的确可以解决这个问题。简单而有必要。

以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”，或扫描下方二维码进行关注，更多干货等着你！

如何减少编码、测试和调试三个阶段的bug？

一、会导致难点bug的问题

二、测试

三、调试

作者: 良许

发表评论取消回复

联系我们

微信扫一扫关注我们

一、会导致难点bug的问题

二、测试

三、调试

给这篇文章的作者打赏

作者: 良许

相关推荐

发表评论 取消回复

联系我们

微信扫一扫关注我们

发表评论取消回复