EagleBear2002 的博客

这里必须根绝一切犹豫,这里任何怯懦都无济于事

摘要

我们提出了 BayeSmith,一个用于自动学习静态分析警报概率模型的通用框架。最近提出了几种概率推理技术,它们结合了对语义事实的外部反馈,从而减少了用户的警报检查负担。然而,这些方法基本上仅限于具有预定义结构的模型,因此无法学习或将有关分析的知识从一个程序转移到另一个程序。此外,这些概率模型通常会积极地从外部反馈中泛化并错误地抑制真正的错误。为了解决这些问题,我们提出了学习概率模型的结构和权重的 BayeSmith。BayeSmith 从一个初始模型和一组带有错误标签的训练程序开始,改进了模型,以根据反馈有效地优先考虑真正的错误。我们通过对一组 C 程序的两个静态分析来评估该方法。我们证明了学习模型显着提高了三个最先进的概率推理系统的性能。

引言

为了应对准确性和警报相关性的挑战,已经为静态程序分析器提出了各种概率程序推理机制。此类系统最初使用基础分析报告目标程序中的一组警报,并根据概率模型计算每个警报的概率。然后,他们通过结合来自各种来源(如用户 [23、39、50]、程序的旧版本 [15] 或动态分析结果 [5])对语义事实的外部反馈,对静态分析警报进行优先级排序。收到响应后,他们会根据反馈进行概括,并根据剩余警报与用户检查的警报的相关性确定其优先级。通过迅速将注意力集中在目标程序中的真正错误上,这些系统实现了静态分析器可用性的显着改进。

尽管他们在实验上取得了成功,但之前的大部分研究都集中在推理问题上,而不是学习上。现有的基于概率推理的方法(例如警报排名 [5,15,39])仅使用标准方法(例如期望最大化算法 [20])学习有限形式的可转移知识(例如将权重分配给基础概率模型)。然而,在我们的观察中,学习能力从根本上受限于概率模型的底层结构

阅读全文 »

摘要

背景:关于使用静态分析工具(例如 FindBugs)的最重要挑战是存在大量开发人员未采取行动的警告。已经提出了许多功能来构建分类模型,以自动识别可操作的警告。通过分析这些功能和相关研究,我们观察到一些限制,使用户缺乏应用这些功能的实用指南。

目的:这项工作旨在对所有公共可用特征进行系统的实验评估,并探索是否存在用于可操作警告识别的黄金特征集。

方法:我们首先进行系统的文献回顾,收集所有公共可用的特征用于警告识别。我们采用 12 个项目,共 60 次修订作为我们的主题项目。然后,我们实施一个工具来提取每个项目修订的所有特征的值,以准备实验数据。

结果:对收集到的 116 个特征的实验评估表明,有一组共同的特征(23 个特征)在大多数项目修订的警告识别中起作用。这些特征可以在警告识别的时间成本低得多的情况下实现令人满意的性能。

阅读全文 »

相关新闻

  • 微信上可以转发支付宝首付款链接:国内产品壁垒在缓慢持续地打开
  • 字节跳动新图标 —— “抖音跳动”
    • 新 CEO 梁汝波 —— “去肥增瘦”
    • 大中台小前台 —— 抖音、大力教育、飞书、火山引擎、朝夕光年和 TikTok 六大业务部门,“APP 工厂”模式终结?
  • 小米“科技”床垫 —— 电加热,治百病,数万元
    • 小米生态链上市公司趣睡科技,“均采用代工生产”
    • 小米生态公司的去小米化
    • 主要靠喜临门代工(股东),授权专利两项,2% 研发投入,收入主要依赖小米和京东
    • 要辩证看待公司优势与问题

为什么要先评估?

  • 从商业模式画布的角度重新阐释战略 —— 战略:产品的设计与运营
  • 对现有商业模式建设性地发问,从战略角度审视你自身商业模式运作的环境
  • 面向你的 企业小组创意 能够演进的方向设计新的商业模式
  • 基于所处的位置(优&劣)与未来的方向(危&机)

变化环境下商业模式的演进

阅读全文 »

Is There A “Golden” Feature Set for Static Warning Identification?

背景:关于使用静态分析工具(例如 FindBugs)的最重要挑战是存在大量开发人员未采取行动的警告。已经提出了许多功能来构建分类模型,以自动识别可操作的警告。通过分析这些功能和相关研究,我们观察到一些限制,使用户缺乏应用这些功能的实用指南。

目的:这项工作旨在对所有公共可用特征进行系统的实验评估,并探索是否存在用于可操作警告识别的黄金特征集。方法:我们首先进行系统的文献回顾,收集所有公共可用的特征用于警告识别。我们采用 12 个项目,共 60 次修订作为我们的主题项目。然后,我们实施一个工具来提取每个项目修订的所有特征的值,以准备实验数据。

结果:对收集到的 116 个特征的实验评估表明,有一组共同的特征(23 个特征)在大多数项目修订的警告识别中起作用。这些特征可以在警告识别的时间成本低得多的情况下实现令人满意的性能。

结论:这些常用的特征可以被视为识别可操作警告的黄金特征集。这一发现可以作为促进现实世界警告识别的实用指南。

阅读全文 »

考点集中:

  1. 选择题 10 道,基本上是单选,共 30 分;
  2. 简答题,4 道,共 25 分;
  3. 计算题,测试用例优先级排序,有公式;
  4. 应用题,基本测试思想去写蜕变规则、测试用例;
  5. 设计模糊测试

源码测试

随机测试

大数定律:测试执行次数够多、测试数据随机生成 \(\to\) 概率低的偶然现象发生

阅读全文 »

本文主要内容来自 SpriCoder的博客,更换了更清晰的图片并对原文的疏漏做了补充和修正。

计算机系统概述

电子数字计算机,是一种能够自行按照已设定的程序进行数据处理的电子设备;是软件与硬件相结合、面向系统、侧重应用的自动化求解工具。

1946 年,首台计算机 ENIAC 诞生于美国。

短短 70 年,计算机技术迅猛发展,从科学计算、数据处理等应用领域,迅速扩展到实时控制、辅助设计、智能模拟等诸多领域。

阅读全文 »

本文主要内容来自 SpriCoder的博客,更换了更清晰的图片并对原文的疏漏做了补充和修正。

操作系统中最基本的抽象

  1. 进程抽象:对已进入主存正在运行的程序在处理器上操作的状态集的抽象
  2. 虚存抽象:是物理内存的抽象,进程可获得一个硕大的连续地址空间来存放可执行程序和数据,可使用虚拟地址来引用物理主存单元。
  3. 文件抽象:是对设备(磁盘)的抽象

阅读全文 »

中央大学及其前身(1902-1949)

三江、两江师范学堂(1902-1912)

1901 年,清政府试行“新政”,颁布《人才为政事之本》的兴学诏书,喻令各省督抚学政兴办各级学堂。南京大学的前身——三江师范学堂便在这样的历史背景下应运而生。

三江师范学堂的创始者,是 1902 年前后相继担任或署理两江总督的刘坤一、张之洞和魏光焘。

刘坤一:倡议“应从师范学堂入手”

阅读全文 »