EagleBear2002 的博客

这里必须根绝一切犹豫,这里任何怯懦都无济于事

自动化测试-04-05-智能软件测试

What is AI ?

How to build ?

Why to test ?

How to test ?

不同基础编程范例

  • 传统软件的决策逻辑:代码形式
  • 深度学习系统的决策逻辑:DNN 的结构、在数据上训练的连接权重

主要观点

  • 神经元的无限行为范围
  • 并非所有这些都是有意义的
  • 训练数据定义的有意义的行为
  • 所有神经元的决策贡献(自我修复)

AI 模糊测试

Fuzzing for AI

AI 软件测试的关键要素

评价指标 Criteria:用于描述在特定测试套件运行时测试程序的程度/置信度的度量。

数据扩展

数据扩增:通过轻微变换现有数据或创建新的合成图像来得到新数据的技术。应用领域有图像扩增、文本扩增、雷达扩增……

增加数据量,减少过拟合

数据扩增原因:

  • 领域数据稀缺
  • 数据分布挑战
  • 数据标注困难
  • 隐藏信息干扰

测试预言

评价指标

鲁棒性

后门攻击

公平性

What have been done?

医学智能测试

风格转移增强 Augmentation by Style Transfer

文本数据扩增