SciTech-Mathmatics-ProbabilitiesAndStatistics-Distribution-is-all-you-need: 概率统计到深度学习

news/2024/9/28 23:38:50

Distribution-is-all-you-need

概率统计到深度学习,四大技术路线图谱,都在这里!
https://github.com/graykode/distribution-is-all-you-need
自然语言处理路线图: 数学基础 -> 语言基础 -> 模型和算法

项目作者:Tae-Hwan Jung, Github:graykode,
2019-09-30 13:35, 选自Github

自然语言处理很多时候都是一门综合性的学问,它远远不止机器学习算法。
相比图像或语音,文本的变化更加复杂。
例如从预处理来看,NLP 就要求我们根据对数据的理解定制一种流程。
而且相比图像等更偏向感知的智能,自然语言包含更高一级的智能能力,
不论是承载思想、情感还是推理。

那么要怎样学习NLP自然语言处理,有什么比较好的路线吗?
通常而言,在数学和机器学习的基础上,
我们还需要了解自然语言的规则与现象,
这样才能进一步探讨该怎样处理自然语言。

本文介绍刚刚发布的一个开源项目,
韩国庆熙大学本科生 Tae-Hwan Jung 总结的一套 NLP 的技术路线图。
值得注意的是,Tae-Hwan Jung 此前已经开源了很多优秀的项目,
包括 4.3k+ star 量的 NLP 教程。
项目地址:https://github.com/graykode/nlp-roadmap

Tae-Hwan Jung 表示,本项目面向对 NLP 感兴趣的学生,
该路线图提供了学习 NLP 的思维导图及关键词信息,
它覆盖了从概率/统计到 SOTA NLP 模型的素材。


如上所示为 NLP 的技术基石,最基础的当然还是数学和算法方面的知识,此外语言学和机器学习知识也必不可少。再往上主要是文本挖掘与 NLP,在作者看来,前者更偏向于常规的算法与浅层机器学习模型,后者更偏向于深度学习模型。

本文介绍刚刚发布的一个开源项目,韩国庆熙大学本科生 Tae-Hwan Jung 总结了一套 NLP 的技术路线图。值得注意的是,Tae-Hwan Jung 此前已经开源了很多优秀的项目,包括 4.3k+ star 量的 NLP 教程。

项目地址:https://github.com/graykode/nlp-roadmap

Tae-Hwan Jung 表示,本项目面向对 NLP 感兴趣的学生,该路线图提供了学习 NLP 的思维导图及关键词信息,它覆盖了从概率/统计到 SOTA NLP 模型的素材。

Image

如上所示为 NLP 的技术基石,最基础的当然还是数学和算法方面的知识,此外语言学和机器学习知识也必不可少。再往上主要是文本挖掘与 NLP,在作者看来,前者更偏向于常规的算法与浅层机器学习模型,后者更偏向于深度学习模型。

四大技术线路图

如下从概率和统计到深度学习方法展示了四大技术路线图,它们从基石到高层展示了完整的知识领域。

概率与统计

Image

机器学习

Image

文本挖掘

Image

自然语言处理

Image

注意:

关键词之间的关系可能解释得比较模糊,因为是以语义思维导图的方式表示的。

读者们只需要看方框内的关键词就行,把它们当作必学部分;

在一张图中容纳如此多的关键词和知识点,非常的难,因此,请切记该路线图只是一种思路或者建议;

推荐阅读:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/30177.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

gcov - 标准c/c++代码覆盖率测试工具+lcov - GCC测试覆盖率的前端图形展示工具+gprof - 标准c/c++代码性能分析工具

1、advent-calendar-of-circuits-2020 - 一个月每天用KiCad设计一个PCB项目 Gregory Davill 是来自澳大利亚的一个技术牛人,在开源硬件领域非常有名且活跃。他在2020年12月坚持每一天设计一个电路板,用 KiCad 完成电路设计到 PCB 的布局布线完成,这便是 advent-calendar-of-…

lua~基本语法

学习 Lua 的必要性nginx开发 apisix,kong插件开发语言特点语句结束没有分号 跟 JavaScript 很像 默认定义的是全局变量,定义局部变量需要加 local 关键字 数组索引从1开始 没有 i++ 操作符号,只能 i = i + 1注释单行注释-- 注释内容多行注释--[[注释内容]]--内置数据类型 总共…

lua~IDEA中调试lua脚本

开发工具IDE工具:jetbrain IDEA 工具插件:EmmyLua本机lua项目和调试lua文件添加lua项目模板,安装完EmmyLua插件就有了添加模板项目后,在项目中添加lua类型的文件为lua项目添加一个编译调试器在调试器中,配置lua和lua项目的信息现在就可以输出hell world了MobDebug pkulche…

salesforce零基础学习(一百三十六)零碎知识点小总结(八)

本篇参考: Salesforce LWC学习(七) Navigation & Toast https://developer.salesforce.com/docs/platform/lwc/guide/use-navigate-url-addressable.html https://help.salesforce.com/s/articleView?id=release-notes.rn_lwc_UrlAddressable.htm&release=250&ty…

使用Consul服务注册和发现

2.1服务注册 2.1.1引入依赖<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-consul-discovery</artifactId> </dependency>2.1.2编写配置文件 server:port: 80 spring:application:name: clou…

在win10右下角显示时间秒

1、首先按组合键“win+r”打开运行窗口,在窗口中输入regedit,按回车键进入注册表编辑器或者按组合键“win+x”在PowerShell中执行命令regedit(效果相同)进入注册表编辑器之后依次找到:HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersio\Explorer\Advanced,新建D…

Consul安装

1.1 Win安装选择我们想要下载的版本点击下载,如果芯片是AMD选择右边下载。 解压下载的文件进入解压之后的文件查看是否成功安装consul agent -dev -dev表示开发模式运行,另外还有-server表示服务模式运行前端查看:1.2 CentOS安装 1.查看系统芯片架构: arch2.安装解压工具un…

图机器学习入门:基本概念介绍

图机器学习(Graph Machine Learning,简称Graph ML)是机器学习的一个分支,专注于利用图形结构的数据。在图形结构中,数据以图的形式表示,其中的节点(或顶点)表示实体,边(或链接)表示实体之间的关系。 本篇文章将从基础开始介绍什么是图,我们如何描述和表示它们,以及…