NLP领域AI产品经理必备的常识及术语

访客3年前黑客文章374

NLP规模AI产物司理必备的知识及术语

产物司理要相识根基的技能,那AI产物司理自然要相识今朝AI规模的根基技能。

虽然我们不必然要把握那些技能但至少要相识根基的知识和专业术语,便于更好的操作AI技能缔造或优化产物;同时可以与技能算法人员更轻松的相同并拥有必然的话语权。

由于今朝丸子妹在从事NLP规模相关产物实践,因此总结了今朝阶段打仗到的AI相关的技能以及日常打仗到的专业术语。但愿给正在筹备入行可能方才入行不久的童鞋一点点辅佐,如有疑问和发起接待列位实时指正和交换。

NLP规模今朝主要有几个大的任务种别:语音识别和生成、文天职类、信息提取、实体识别、对话系统、呆板翻译、感情阐明、常识图谱等。而每一个大类都有较量经典常用的技能和算法模子,相识了这些知识就可以在有新的任务时做好足够的项目预判及评估。

但由于算法的不绝优化创新,新的算法层出不穷。因此需要越发实时的存眷规模顶会论文动态及新模子的黑白,不必一味追求最新的算法;而是通过比拟阐明选择更符合在本身的产物业务中落地的算法。

一、常见任务及当下经典算法

文天职类/意图识别CNN / Bert / LSTM+Attention

实体识别:LSTM+CRF

中文分词:N-Gram / CRF / HMM

文内情似度:TF-IDF / BM25+Bert

文本摘要Bert+Textrank

问答系统/呆板翻译:Transformer+Bert / Seq2seq+Attention

感情阐明:Word2vec+LSTM / CNN

二、常见常识点、术语

人工智能规模两类算法:基于统计的呆板进修算法(Machine Learning) / 深度进修算法(Deep Learning)

人工智能三要素:算法、算力、数据

常用的框架:pytorch / sklearn / tensorflow /PaddlePaddle

数据标注:为模子练习提供进修语料的数据处理惩罚,一般为人工+系统相团结

预练习模子:用某个较大的数据集练习好的模子(给出了可利用的初始化参数),你可以操作它利用自有数据集举办练习并获得符合的模子参数

词向量:即将文字数字化,操作数学规模的向量暗示单词/短语

语料:语言质料,提供应算法模子举办进修的根基常识

批处理惩罚巨细:即练习的 batch_size

练习数据的练习次数:练习 epoch 数

进修率:即 learning_rate

三、词向量维度: *** 中词向量的维度

各层 *** 卷积核巨细:即 kernel_size

窗口巨细:skip-gram 算法中的 window_size 参数

过拟合:在模子练习进程中结果较好但在测试样本中精确率较差,表示为模子过度依赖于练习语料,反之可以领略“欠拟合”

模子蒸馏:算法可以或许用小型的 *** 从微调过的文天职类模子中进修信息

蒸馏练习次数:蒸馏进程遍历蒸馏数据的次数

评估尺度:精确率、召回率、F1、AUC、ROC、损失函数

监视进修:通过已有的练习语料完成模子练习,从而在测试样本验证模子已经进修到的本领

强化进修:将一个已经练习好的模子作为另一个任务的基本模子,低落本钱

相关文章

23张图,带你入门推荐系统

23张图,带你入门推荐系统

编辑导语:跟着电子商务局限的不绝扩大、商品个数和种类快速增长,顾主需要耗费大量的时间才气找到本身想买的商品。这种欣赏大量无关的信息无疑会使沉没在信息过载问题中的消费者不绝流失。为办理这些问题,推荐系统...

医疗行业信息化相关知识

医疗行业信息化相关知识

编辑导读:本文环绕医疗行业信息化的相关常识举办展开,作者主要对医院科室漫衍、医院人才布局和大夫职业成长举办了梳理,进而辅佐各人形成对医疗行业的认识和相识,但愿对你有用。 一直从事医疗规模的设计事情,...

产品决策可以感性,但要形成共识

产品决策可以感性,但要形成共识

编辑导语:在团队做产物时,产物决定时总会碰着一些分歧可能是没有规避风险等等一些问题;我们在做决定时,必然要留意感性和理性的把控,才气到达最好的结果;本文作者提出了产物决定时会碰着的几个问题,我们一起来...

啥?昨晚双11?

啥?昨晚双11?

编辑导读:一年一度的双十一已启动预售,与往年的双十一差异的是,本年的双十一分为两波勾当期:11月1日至3日为第一波,11月11日为第二波,两波售卖期价值要求一致,都是最优惠的价值。调解的背后,平台有着...

宠物看病也搞“云诊断”?

宠物看病也搞“云诊断”?

编辑导读:跟着互联网的成长,人们看病可以在网上预约,也可以在电商平台买药,拓宽了医疗场景。在线问诊许多人已经不生疏。那么,近期网上开始呈现的宠物“云诊断”、“云治疗”业务,你是否有所相识?本文作者对宠...

通用合同管理系统设计方案(三)

通用合同管理系统设计方案(三)

编辑导读:条约从拟稿到签订、打点再到最终执行,别离对应前面三篇的条约审批流程、条约的线上打点和条约的报表设计以及本篇的条约改观和管控。本篇主要先容条约的改观和条约的管控,作为条约打点系列的完结。 一...