首页 热搜新型 关注要闻 VR视点 话题日报
主页 > 话题日报 >42 个「资讯安全」与「人工智慧」领域的学习资源,从论文到开 >

42 个「资讯安全」与「人工智慧」领域的学习资源,从论文到开

42 个「资讯安全」与「人工智慧」领域的学习资源,从论文到开

外媒 KDnuggets 刊登了一篇机器学习与 网路安全 相关的资料大汇总,文中列出了相关资料来源的获取途径,优秀的论文和书籍,以及丰富的教程。大部分都是作者在日常工作和学习中亲自使用并认为值得使用的纯乾货,雷锋网现编译总结如下。

资料来源

SecRepo.com 网站,该网站汇聚了大量的与机器学习和网路安全相关的资料来源,并提供免费下载。据网站首页介绍,所有可用的资料来源包含两个部分:一是网站方面自己整理的,二是来自第三方的。其内容包括网路扫描数据,恶意软体源码,以及和网路安全相关的系统日誌等。

论文
    Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks

本文来自卡内基梅隆大学,分析了通用符号密码的脆弱性,以及目前常见的密码健壮性检验的各种缺点,甚至给出了他们在实验室利用 神经网路算法攻破各种符号密码的具体步骤,非常强大。

    Outside the Closed World: On Using Machine Learning for Network Intrusion Detection

本文来自加州柏克莱大学,分析了利用机器学习探测网路安全的优势和劣势,并给出了一些改善这些劣势的解决方案。

    Anomalous Payload-Based Network Intrusion Detection

通常网路上的恶意请求都会在真正的恶意程式码外部包装一层善意的外衣,这大大阻碍了相关探测程序的正常工作。来自哥伦比亚大学的 Ke Wang 和 Salvatore J. Stolfo 两位学者在本文中给出了一种全新的探测恶意程式码中有效程式码段的方法,并在实测中达到了接近 100%正确率和 0.1%的误报率。

    Malicious PDF detection using metadata and structural features

当前,随着防範措施的升级,恶意程式码隐藏在 PDF 和 Word 等文本文件中的例子屡见不鲜,用户防不胜防。在本文中,来自乔治梅森大学的学者介绍了一种通过机器学习技术探测恶意文本文件的技术,特别是内含恶意程式码的 PDF 文件。

    Adversarial support vector machine learning

来自德州大学,介绍了两种利用机器学习技术探测网路恶意攻击的分析模型,即无边界攻击模型(free-range attack model)和限制边界攻击模型(restrained attack model)。

    Exploiting machine learning to subvert your spam filter

垃圾邮件过滤系统不算什幺高新技术,但如何提升过滤的準确性一直是一个难题。本文中来自加州柏克莱大学的学者们介绍了一种基于机器学习开发的垃圾邮件过滤器,为垃圾邮件的过滤提供了一种全新的实现思路。

以下论文来自  covert.io 网站,该网站的论文(或部落格)数量庞大,但并不像上文提到的那些论文一样全部来自美国高校,covert.io 的文章也来自各大科技公司和研究所。

    CAMP: Content-Agnostic Malware Protection

来自 Google,介绍了一种名为 CAMP 的恶意软体保护系统,该系统能够通过对二进制可执行文件的探测,确保网路的软体应用安全。

    Building a Dynamic Reputation System for DNS

DNS 服务器一直是网路中非常重要的组成部分,针对目前越来越流行的 DNS 攻击,来自乔治亚理工学院的学者介绍了一种名为 Notos 的动态的域名信誉系统,可以有效防範各种针对 DNS 服务器的匿名的网路骇客攻击。

    Detecting malware domains at the upper dns hierarchy

本文介绍了一种名为 Kopis 的新型域名检测系统,可以有效探测网路上包含恶意攻击程式码的域名,由网路安全公司 Damballa、乔治亚理工学院和乔治亚大学联合研发。

    From Throw-away Traffic To Bots – Detecting The Rise Of DGA-based Malware

本文同样来自 Damballa 公司和乔治亚大学,介绍了一种针对殭尸网路的新技术,该技术够探测来自动态域名系统的恶意攻击,整合了聚合和分类两类算法。

    EXPOSURE: Finding Malicious Domains Using Passive DNS Analysis

DNS 服务器成为了越来越多骇客的攻击对象,本文介绍了一种名为 EXPOSURE 的域名分析系统,可以针对大批量的域名恶意访问进行探测,由 Eurecom 研究所、波士顿东北大学和加州大学共同研发。

    Polonium: Tera-Scale Graph Mining for Malware Detection

本文来自网路安全公司 Symantec、卡内基梅隆大学,介绍了一个名为 Polonium 的高效的可扩展的恶意软体探测系统。

    Nazca: Detecting Malware Distribution in Large-Scale Networks

大量用户在现实生活中下载并安装恶意软体的行为通常包含一定的规律性。来自加州大学圣塔巴巴拉分校、Narus 公司的学者们将这些无人问津的数据利用起来,提出了一个名为 Nazca 的网路安全探测系统。

    Anagram: A Content Anomaly Detector Resistant to Mimicry Attack

来自哥伦比亚大学,介绍了一个名为 Anagram 的异常数据报文探测器。

书籍

讲述数据科学和机器学习在网路安全领域的应用的书籍并不多,作者只介绍了以下两本。

    Data Mining and Machine Learning in Cyber​​security

作者是来自路易斯安那 理工大学的 Sumeet Dua 博士和 Xian Du 博士,探讨了目前普遍存在的网路安全问题以及最先进的机器学习和数据挖掘解决方案。

    Machine Learning and Data Mining for Computer Security

编者是来自乔治城大学的 Marcus A. Maloof,该书系统介绍了数据挖掘和机器学习技术在电脑安全领域的最新研究成果。

(雷锋网注:目前两本书都没有中文版,纸质版在亚马逊上的售价都超过 1000 人民币,第一本有 Kindle 电子版。)

演讲

原文作者收集了如下一些关于机器学习和网路安全的演讲,演讲者们要幺是来自相关领域的公司副总、技术负责人,要幺是各大高校的研究人员、博士或者教授。(雷锋网注:国内访问需要科学上网。)

    Using Machine Learning to Support Information Security

影片介绍了机器学习在讯息安全领域的应用,时长约 1 小时。

    Defending Networks with Incomplete Information

要在限定的时间内(通常是 24 小时)对恶意攻击做出反应通常需要耗费巨大的人力和物力,但是如果利用机器学习的方法,首先对网路攻击进行优先级和攻击方式分类,甚至处理一些简单的套路式的攻击,则可以大大降低网路安全工程师的工作强度。影片就介绍了这一思路的具体应用,时长约 47 分钟。

    Applying Machine Learning to Network Security Monitoring

这个影片介绍了如何将机器学习应用于网路安全探测,时长约 1 小时。

    Measuring the IQ of your Threat Intelligence Feed

目前网路上存在着各种各样的网路安全的探测系统,但是用户对它们褒贬不一,究竟如何判断一个探测系统的可靠性,影片介绍了一种实用的判断方法,时长约 40 分钟。

    Data-Driven Threat Intelligence: Metrics On Indicator Dissemination And Sharing

影片介绍了数据驱动下的安全情报分析,特别是和社交网路分享和传播相关的,时长约 48 分钟。

    Applied Machine Learning for Data Exfil and Other Fun Topics

为了帮助网路安全相关的研究者、分析师和极客爱好者了解机器学习,以及如何将机器学习应用在网路安全中领域中,例如数据洩露,影片做了详细介绍,时长约 43 分钟。

    Secure Because Math: A Deep-Dive on ML-Based Monitoring

影片介绍了以机器学习技术为基础的网路监控,时长约 46 分钟。

    Machine Duping 101: Pwning Deep Learning Systems

44 分钟教你攻克一个深度学习系统,必看系列。

    Weaponizing Data Science for Social Engineering

影片介绍了社交网路中的恶意攻击行为和数据科学对此可能发挥的作用,时长约 44 分钟。

    Defeating Machine Learning What Your Security Vendor Is Not Telling You

还是关于攻破机器学习的话题,影片介绍了如何攻破以机器学习为基础的网路安全产品,时长约 50 分钟。

    CrowdSource: Crowd Trained Machine Learning Model for Malware Capability Det

影片介绍了如何利用机器学习模型来探测网路安全,时长约 28 分钟。

    Defeating Machine Learning: Systemic Deficiencies for Detecting Malware

系统的「缺陷」也能用来探测恶意软体?这个影片用 45 分钟为你详细讲解利用机器学习和系统「缺陷」来探测恶意软体的方法。

    Packet Capture Village – Theodora Titonis – How Machine Learning Finds Malware

影片介绍了如何利用机器学习探测移动端恶意软体,时长约 44 分钟。

    Build an Antivirus in 5 Min – Fresh Machine Learning

影片用 5 分钟介绍了如何用网路上开源的机器学习框架编写一个全新的防病毒程序。

    Hunting for Malware with Machine Learning

影片介绍了针对企业用户的自动化恶意软体探测系统,时长约 48 分钟。

项目和教程
    Click Security Data Hacking Project

该项目包含了一系列与 IPython、Pandas、Scikit Learn 相关的练习,包含笔记和原程式码,每个练习都会故意设置一些常见的程式码错误、数据库错误和逻辑错误供使用者改正。该系列教程几乎是机器学习在讯息安全领域应用的必学教程。

    Using Neural Networks to generate human readable passwords

连结中是一位大神自己编写的一个基于 Keras 框架和 Python 语言的密码生成器,利用了深度神经网路原理,在保证密码安全性的同时也保证了易读性。该项目的程式码已经在 Github 上开源,可以结合上文提到的论文 《Fast, Lean, and Accurate: Modeling Password Guessability Using Neural Networks》一起学习。

(开放原始码:连结)

    Machine Learning based Password Strength Classification

该项目关于用机器学习算法判断一个已知密码的健壮性,程式码已经在 Github 上开源。

(开放原始码:连结)

    Using Machine Learning to Detect Malicious URLs

该项目关于如何利用机器学习探测恶意的网路连结地址,据称可以达到 98%的正确率。

(开放原始码:连结)

    Big Data and Data Science for Security and Fraud Detection

这是一篇综述文章,文中介绍了多个国家/地区/大公司正在使用或研发的大数据分析工具和技术,这些技术结合了文本挖掘、机器学习或者网路分析,能够在早期阶段对网路安全威胁进行检测和预防。

    Using deep learning to break a Captcha system

这是一篇部落格文章,介绍了如何利用深度学习技术破解烦人的验证码系统,作者在文中给出了部分关键功能模块的开放原始码,并且在文末还给出了许多参考连结。

    Data Mining for Cyber​​ Security

这是史丹佛大学开设的一个系列公开课,关于数据挖掘在网路安全中的应用。在连结中可以直接看到课程安排,下载到讲师演讲的文本记录、PPT,查看课后作业的题目和此前同学上传的答案,以及课后的深入阅读列表。这一课程可能是数据科学目前在网路安全领域已经公开的最好的课程之一。

其他
    System predicts 85 percent of cyber-attacks using input from human experts

这是一篇研究成果介绍的文章,介绍了来自 MIT 电脑科学与 人工智慧实验室(CSAIL)和一家机器学习初创公司 PatternEx 的最新研究成果:

一个名为 AI2 的人工 智慧平台,能够根据人类网路安全专家输入的数据,对当前网路可能遭到的安全威胁做出预测,正确率高达 85%,超越了目前已知的其他同类预测系统。文中通过文字和影片的方式讲解了这一预测系统的基本工作原理。

    MLSec

这是一个开源项目相关的网站,该网站聚合了一系列将机器学习技术应用于网路安全领域的开源项目,同时还开设了部落格文章和社区讨论频道,帮助开发者对这些项目深入理解。

    An Introduction to Machine Learning for Cyber​​security and Threat Hunting

这是一篇深度文章,通过与几位数据科学大牛访谈的形式,详细介绍了机器学习和网路安全的关係以及相关应用。

以上只是这位外国大牛的总结,如果你手里也有一些值得安利的干货和资源,不妨在文末留言分享出来吧!

(附原文作者简介:Faizan Ahmad,Fulbright 计划大学生,目前在巴基斯坦国立计算机与新兴科学大学(National University of Computer and Emerging Sciences)学习,同时在巴基斯坦的拉合尔管理科学大学(Lahore University of Management Sciences)担任研究助理,主攻电脑和网路安全研究方向。)



上一篇: 下一篇:

相关推荐