35 如何准备测试数据?
你好,我是茹炳晟,今天我和你分享的主题是:如何准备测试数据。
从今天开始,我们将一起进入测试数据准备这个新的系列了。我会用四篇文章,和你详细探讨软件测试过程中关于测试数据准备的话题。我会依次分享测试数据创建的基本方法、测试数据准备的痛点、自行开发的测试数据工具,以及目前业内最先进的统一测试数据平台。
你我都非常清楚,测试数据的准备是软件测试过程中非常重要的一个环节,无论是手工测试,还是自动化测试,无论是GUI测试,还是API测试,无论是功能测试,还是性能测试,都避不开测试数据准备的工作。
所以,如果你想要成长为一名优秀的测试工程师,那就非常有必要深入理解测试数据准备的方法,以及它们各自的优缺点、适用场景了。
今天,我们就先从测试数据准备的基本方法开始吧。
从创建测试数据的维度来看,测试数据准备方法主要可以分为四类:
- 基于GUI操作生成测试数据;
- 通过API调用生成测试数据;
- 通过数据库操作生成测试数据;
- 综合运用API和数据库的方式生成测试数据。
这时,相信你已经回想起我曾在第15篇文章《过不了的坎:聊聊GUI自动化过程中的测试数据》中从创建测试数据的维度和你分享过这些内容,这次的分享只不过是多了“通过GUI调用生成测试数据”的方法。
其实,我在第15篇文章的分享内容,只是简单的介绍了GUI测试数据准备的方法,并没有详细展开。事后,你可能也感觉不太过瘾,想知道一些更深入、更细节、更贴近业务场景的测试数据准备的知识。所以,也就有了我今天的这次分享。
那么,接下来我们就赶紧开始吧,一起聊聊这四种测试数据准备的方法。
基于GUI操作生成测试数据
基于GUI操作生成测试数据,是最原始的创建测试数据的方法。简单地说,它就是采用E2E的方式来执行业务场景,然后生成数据的方法。
比如,你想要测试用户登录功能,那么首先就要准备一个已经注册的用户,为此你可以直接通过GUI界面来注册一个新用户,然后用这个新创建的用户完成用户登录功能的测试。
这个方法的优点是简单直接,在技术上没有任何复杂性,而且所创建的数据完全来自于真实的业务流程,可以最大程度保证数据的正确性。但是,该方法的缺点也十分明显,主要体现在以下这四个方面:
- 创建测试数据的效率非常低。一是因为每次执行GUI业务操作都只能创建一条数据,二是因为基于GUI操作的执行过程比较耗时。
- 基于GUI的测试数据创建方法不适合封装成测试数据工具。由于测试数据的创建是通过GUI操作实现的,所以把这种数据创建方法封装成测试数据准备工具的过程,其实就是在开发GUI自动化测试用例。无论是从开发工作量,还是从执行效率来讲,把基于GUI操作的测试数据创建方法封装成测试数据准备工具都不是最佳的选择。
- 测试数据成功创建的概率不会太高。因为,测试数据准备的成功率受限于GUI自动化执行的稳定性,而且任何界面的变更都有可能引发测试数据创建的失败。
- 会引入不必要的测试依赖。比如,你的被测对象是用户登录功能,通过GUI页面操作准备这个已经注册的用户,就首先要保证用户注册功能没有问题,而这显然是不合理的。
鉴于以上四方面的原因,在实际的测试过程中,我们很少直接使用基于GUI的操作生成测试数据。只有在万不得已的情况下,比如没有其他更好的方式可以创建正确可靠的测试数据时,我们才会使用这个方法。
而且,这里我需要说明的是,基于GUI操作生成测试数据的方法一般只用于手工测试,因为自动化测试中使用这种数据准备方法,基本相当于要开发一个完整的GUI自动化测试用例,代价太大。
那我为什么还要介绍这个方法呢?其实,这个方法更重要的应用场景是,帮助我们找到创建一个测试数据的过程中,后端调用了哪些API,以及修改了哪些数据库的业务表,是“通过API调用生成测试数据”,以及“通过数据库操作生成测试数据”这两种方法的基础。
通过API调用生成测试数据
通过API调用生成测试数据,是目前主流的测试数据生成方法。其实,当我们通过操作GUI界面生成测试数据时,实际的业务操作往往是由后端的API调用完成的。所以,我们完全可以通过直接调用后端API生成测试数据。
还是以用户登录功能的测试为例,我们通过GUI界面注册新用户时,实际上就是调用了createUser这个API。既然知道了具体要调用哪个API,那么我们就可以跳过在GUI界面的操作,直接调用createUser生成“已经注册的用户”这个测试数据了。
为了规避在创建测试数据时过于在乎实现细节的问题,在实际工程实践中,我们往往会把调用API生成测试数据的过程封装成测试数据准备函数。那问题是,我怎么才能知道前端新用户注册这个操作到底调用了哪些后端API呢?这里,我推荐三种方式:
- 直接询问开发人员,这是最直接的方法;
- 如果你有一定的代码基础,可以直接阅读源代码,这个方法也可以作为直接询问方法的补充;
- 在一个你可以独占的环境上执行GUI操作创建测试数据,与此同时监控服务器端的调用日志,分析这个过程到底调用了哪些API。
通过API调用生成测试数据的方法,优点主要体现在以下几个方面:
- 可以保证创建的测试数据的准确性,原因是使用了和GUI操作同样的API调用;
- 测试数据准备的执行效率更高,因为该方法跳过了耗时的GUI操作;
- 把创建测试数据的API调用过程,封装成测试数据函数更方便,因为这个调用过程的代码逻辑非常清晰;
- 测试数据的创建可以完全依赖于API调用,当创建测试数据的内部逻辑有变更时,由于此时API内部的实现逻辑也会由开发人员同步更新,所以我们依旧可以通过调用API来得到逻辑变更后的测试数据,而这个过程对使用来说是完全透明的。
但是,该方法也不是完美无瑕的,其缺点主要表现在:
- 并不是所有的测试数据创建都有对应的API支持。也就是说,并不是所有的数据都可以通过API调用的方式创建,有些操作还是必须依赖于数据库的CRUD操作。那么,这时,我们就不得不在测试数据准备函数中加入数据库的CRUD操作生成测试数据了。
- 有时,创建一条业务线上的测试数据,往往需要按一定的顺序依次调用多个API,并且会在多个API调用之间传递数据,这也无形中增加了测试数据准备函数的复杂性。
- 虽然相比于GUI操作方式,基于API调用的方式在执行速度上已经得到了大幅提升,并且还可以很方便地实现并发执行(比如,使用JMeter或者Locust),但是对于需要批量创建海量数据的场景,还是会力不从心。
因此,业界往往还会通过数据库的CRUD操作生成测试数据。
通过数据库操作生成测试数据
通过数据库操作生成测试数据,也是目前主流的测试数据生成方法。这个方法的实现原理很简单,就是直接通过数据库操作,将测试数据插入到被测系统的后台数据库中。
常见的做法是,将创建数据需要用到的SQL语句封装成一个个的测试数据准备函数,当我们需要创建数据时,直接调用这些封装好的函数即可。
还是以用户登录功能测试为例,当我们通过GUI界面注册新用户时,实际上是在后端调用了createUser这个API,而这个API的内部实现逻辑是,将用户的详细信息插入到了userTable和userRoleTable这两张业务表中。
那么此时,我们就可以直接在userTable和userRoleTable这两张业务表中插入数据,然后完成这个新用户的注册工作。
这样做的前提是,你需要知道前端用户通过GUI操作注册新用户时,到底修改了哪些数据库的业务表。这里,我也推荐三种方式:
- 直接向开发人员索要使用到的SQL语句;
- 直接阅读产品源代码;
- 在一个你可以独占的环境上执行GUI操作产生测试数据,与此同时,监控独占环境的数据库端业务表的变化,找到哪些业务表发生了变化。
通过数据库操作生成测试数据的方法,主要优点是测试数据的生成效率非常高,可以在较短的时间内创建大批量的测试数据。
当然,这个方法的缺点也非常明显,主要体现在以下几个方面:
- 很多时候,一个前端操作引发的数据创建,往往会修改很多张表,因此封装的数据准备函数的维护成本要高得多;
- 容易出现数据不完整的情况,比如一个业务操作,实际上在一张主表和一张附表中插入了记录,但是基于数据库操作的数据创建可能只在主表中插入了记录,这种错误一般都会比较隐蔽,往往只在一些特定的操作下才会发生异常;
- 当业务逻辑发生变化时,即SQL语句有变化时,需要维护和更新已经封装的数据准备函数。
综合运用API和数据库的方式生成测试数据
目前,在实际的工程实践中,很少使用单一的方法生成测试数据,基本都是采用API和数据库相结合的方式。最典型的应用场景是,先通过API调用生成基础的测试数据,然后使用数据库的CRUD操作生成符合特殊测试需求的数据。所以,你经常会看到很多的数据准备函数中,既有API操作,又有数据库操作。
我以创建用户为例,和你分享一下如何综合运用API和数据库两种方式创建测试数据吧。
假设,我们需要封装一个创建用户的函数,这个函数需要对外暴露“用户国家”和“支付方式”这两个参数。由于实际创建用户是通过后台createUser API完成的,但是这个API并不支持指定“用户国家”和“支付方式”,所以我们就需要自己封装一个创建用户的函数。
自己封装用户创建函数的方法,你可以通过下面这个思路实现:
- 首先,调用createUser API完成基本用户的创建;
- 然后,调用paymentMethod API实现用户对于不同支付方式的绑定,其中paymentMethod API使用的userID就是上一步中createUser API产生的用户ID;
- 最后,通过数据库的SQL语句更新“用户国家”。
在这个例子中,createUser API和paymentMethod API只是为了说明如何综合运用API的顺序调用,而其具体参数并不是我要阐述的关键内容,所以我并没有和你详细说明这两个API的参数、实现方式等问题。另外,我在最后一步综合运用了数据库的CRUD操作,完成了创建测试数据的全部工作。
这,就是一个封装测试数据准备函数的典型例子了。
总结
今天,我从测试数据创建的角度,和你分享了准备测试数据的四种方法。
其中,基于GUI操作生成测试数据是最原始的方法,但是效率很低,而且会引入不必要的依赖;通过API调用以及数据库操作的方式生成测试数据是目前主流的做法,通过API调用的方式具有数据准确度高但是创建效率较低的特点,而通过数据库的方式具有创建效率高但是维护复杂度也高的特点。
所以,在实际项目中,业界往往会综合采用API和数据库的方式生成测试数据,即通过API调用生成基础数据,然后使用数据库的CRUD操作进一步生成符合特殊测试需求的数据。
思考题
目前,我们需要创建的测试数据并不仅仅局限于数据库,很多时候还需要创建消息队列里面的数据。你在实际工作中遇到过这类测试数据吗?你又是如何处理的呢?
感谢你的收听,欢迎你给我留言。
- 静静张 👍(2) 💬(1)
我们是在测试用例执行前通过api创建数据,执行后清除数据的方式。
2018-11-18 - 夏洛克的救赎 👍(1) 💬(1)
“基于 GUI 的测试数据创建方法不适合封装成测试数据工具” 测试数据工具?用JavaScript实现?
2018-10-01 - wenjun 👍(17) 💬(2)
测试数据这个问题困扰了我很久,基本上成为团队进一步发展的瓶颈之一。 想请教一下老师,对于前台和中台团队,下面难点怎么突破: 1.最终数据,部分数据不是实时生成的,例如需要后台清算才能产生。 2.依赖于多个后台系统,他们分别产生不同的数据,存储在不同的数据库中。中台需要整个这些数据。 以上两个方面需要如何高效的产生和维护真实可靠的测试数据呢?(目前是搞一套完整的系统,自动化跑清算,感觉成本太高)
2018-11-01 - sylan215 👍(7) 💬(0)
1.如果使用非 GUI 操作获取测试数据,一定要保证使用的方法和 GUI 操作路径/逻辑是一致的,不然没法保证测试的一致性了; 2.如果是一次性操作,其实 GUI 操作的成本并不高(或者使用 GUI 操作的接口,而不是额外开发的接口),其他方法可能会涉及单独的开发工作量吧,特别是数据库,大部分业务的数据库表都是关联的,如果改不好,可能定位问题就需要很长时间; 3.另外也需要关注测试数据的恢复,保证数据的一致性。 以上,欢迎沟通交流,公众号「sylan215」
2018-09-17 - 阿星星阿 👍(5) 💬(0)
直接写sql的话对简单链路还好,如果像订单这种比较大的业务链路成本会不会有点高
2019-06-11 - 楚耳 👍(5) 💬(3)
老师,你文中提到的在一个你可以独占的环境上执监控服务器端的调用日志,和数据库日志,这其中分别用的是什么工具进行监控的
2018-10-31 - shane 👍(3) 💬(0)
我们是两种方式都有,但我们有个原则,即便是死数据,只要是新增的测试用例,我们都尽量重新造所需的数据,这样就不会影响旧的数据,互不干扰
2019-07-22 - 胖虫子 👍(2) 💬(0)
遇到过一次测试,很多的测试数据需要操作很多步骤才能得到,只是为了测试方便,也为了节约时间,采用katalon提供的web录制回访,虽然也是gui的,但因为是录制回访,所以也没花太多的时间
2018-11-01 - Middleware 👍(1) 💬(0)
最近被测试数据填充困扰了,看了专栏 豁然开朗
2020-11-07 - 毛毛雨 👍(1) 💬(0)
问大家一个额外的问题是关于配置maven本地仓库的,我安装配置好maven(3.5.3)版本。。。所有环境都正常;就是想构建本地仓库时,一直都不成功:输入mvn help:system ,然后一直BUILD FAILURE ,打印[ERROR] No plugin found for prefix 'help' in the current project and in the plugin groups [org.apache.maven.plugins, org.codehaus.mojo] available from the repositories [local (E:\maven\m2), aliyunmaven (https://maven.aliyun.com/repository/public)] ;我百度了很多方法都没用;而且同样的操作同样的文件参数,我用笔记本配了是可以的;很想问问大家有没有什么思路或者解决方法来提供,因为困扰我好多天了,蟹蟹
2020-08-26 - 捷后愚生 👍(1) 💬(0)
所在项目之前基本都是通过GUI准备测试数据,效率的确是低下,不过因为准备的数据可以多次使用,所以数据准备方面不是花太多的时间。就是涉及与其他关联系统的时候,比较麻烦,如需要准备一个有结算账号的对公客户,所在系统只能创建客户,需要核心系统才能创建账号,所以只能是联系核心系统在对方系统数据库插入数据,过程相当麻烦。 自己在做GUI自动化测试的时候,专门写了一些脚本,通过GUI准备测试数据,因为数据量不大,所以足够我使用。 后来搭建了造数平台,准备数据相对方便了一些。是先在造数平台造数,然后在信贷系统逐一引入客户,其实效率也不高,但是流程方便了很多。
2020-08-01 - 付晓杰 👍(0) 💬(0)
测试数据准备方法主要可以分为四类: 1.基于 GUI 操作生成测试数据; 2.通过 API 调用生成测试数据; 3.通过数据库操作生成测试数据; 4.综合运用 API 和数据库的方式生成测试数据。
2022-09-02 - 小昭 👍(0) 💬(0)
目前测试需要两种数据,一种是类似用户登录的,直接通过界面操作获得;另一种是业务数据,用python调接口推的。 每个迭代我们是尽量用新数据,历史数据说不定哪儿就会有一些奇奇怪怪的问题。
2022-02-10 - 东方不败之鸭梨 👍(0) 💬(0)
目前公司做测试,测试数据采用两种方法 1.GUI操作生成 效率低,浪费时间,数据浪费后仍需要从头到尾操作一遍。 2.IT从生产系统down数据到测试环境 其他方式也没有采取过,看来以后要考虑实践下其他方式,也是解放自己的生产力。
2020-07-22 - Bella2019jike 👍(0) 💬(0)
现在的微服务项目中,用接口造数是比较常用的方式,不太推荐GUI,不稳定且线路太慢。如果接口结合数据库是不错的选择。
2020-03-25