ImageVerifierCode 换一换
格式:DOCX , 页数:6 ,大小:36.91KB ,
资源ID:793550      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-793550-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(《机器学习实践应用》读书笔记.docx)为本站会员(a****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至kefu@ketangku.com或直接QQ联系客服),我们立即给予删除!

《机器学习实践应用》读书笔记.docx

1、机器学习实践应用读书笔记这次的读书笔记主要介绍机器学习背景和基础概念1 机器学习背景数据现状20世纪70年代曾遇巨大瓶颈,原因有计算能力 + 数据量的不足。随着互联网的普及和对用户数据的大量采集,数据量不足的问题已逐渐弥补,机器学习算法的价值越来越大。但在传统领域,如建筑行业,数据产生于工地的一砖一瓦,采集起来会更困难和麻烦,随着图像识别技术的进步和普及,这样的问题能够慢慢解决,但不得不说,传统领域的数据智能化仍然是比较慢的进程。(这里可以自行了解下百度在传统领域的AI技术落地情况)。目前主流的机器学习算法是监督学习算法,该算法需要的是打标过的数据,而数据的打标十分依赖人工标记,之前在实习的时

2、候,给短视频的标签做标记都能把我搞得头昏脑涨。人工打标有几个问题:成本高 + 量级小机器学习算法现状机器学习已渗透到生活的各个方面,特别是在互联网领域。用网购场景来举例。1)你在路上看到陌生人的一件T恤你很喜欢 使用淘宝的【拍立淘】(图像识别技术)2)在淘宝搜索框语音输入商品名称(语音转文字技术)3)商品的个性化推荐(推荐算法)4)商品下单 若钱不够用 借钱 贷款额度显示(由机器学习算法计算)5)下单后 短时间完成商品包装、库存发货到中转库存、从低级仓库到高级仓库配送、向下分发(机器学习算法)6)快递员配送 系统设计最优路线(机器学习算法规划)7)商品投诉 智能客服立即回复(文本的语义分析算法

3、,精准确定问题)以上的过程涉及了模型的训练和预测、语义分析、文本情感分析、图像识别以及语音识别技术机器学习高频场景1)聚类场景人群划分和产品种类划分等2)分类场景广告投放预测和网站用户点击预测等3)回归场景降雨量预测、商品购买量预测和股票成交额预测等4)文本分析场景新闻标签提取、文本自动分类和文本关键信息抽取5)关系图算法社交网络关系网络关系挖掘和金融风险控制等6)模式识别语音识别、图像识别和手写字识别总评机器学习+ 是大趋势2 基本概念机器学习流程1)场景解析把业务逻辑和算法进行匹配2)数据预处理清洗数据,将数据进行归一化或标准化,减少量纲和噪音。3)特征工程机器学习最重要步骤。在算法固定的

4、情况下,特征的选择决定了模型的效果4)模型训练训练数据经过了预处理 + 特征工程后进入训练阶段。5)模型评估对各模型的预测结果评估6)离线/在线服务数据源结构1)结构化数据矩阵结构存储,通常包含特征列+目标列。机器学习算法通常只支持结构化数据2)非结构化数据图像、文本或语音文件,不以矩阵机构存储,是目前技术热点,通常将其转化为二进制存储格式3)半结构化数据典型的半结构化数据是XML拓展名的存储数据算法分类1)监督学习有特征值+目标队列,依赖打标,常用于回归和分类算法2)无监督学习无目标值,不依赖数据的打标,通常用于聚类算法3)半监督学习对样本的部分进行打标,一种半监督算法 标签传播算法4)强化学习人工智能领域热点。系统与外界不断交互,从而决定自身的行为,如无人汽车驾驶和阿法狗下围棋使用机器学习算法常见问题过拟合问题算法结果评估1、精确率、召回率、F1值2、ROC和AUC另外还需要了解的指标:TP、FP、TN、FN总评基础概念的理解有利于帮助入门

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1