pytorch-时间序列

news/2024/7/8 4:52:25 标签: pytorch, 人工智能, python

目录

  • 1. 时间序列
  • 2. word embedding
    • 2.1 one hot
    • 2.2 word2vec
    • 2.3 GloVe

1. 时间序列

具有时间相关性的序列叫做时间序列,比如:语音、文本句子

2. word embedding

2.1 one hot

针对句子来说,可以用[seq_len, vector_len]
有多少个单词vector_len就是多少,比如汉字有3500个,句子长度是5,那么就表示为[5, 3500]
如下图:
vector index 0为1表示Rome, index 1为1表示Pairs,其他位置都为0
在这里插入图片描述
one hot编码的问题是:比较稀疏,数据长度可能比较长,但是有用的数据比较少。比如:英文常用单词有2-4w个,那么这种方式就很难用了。

2.2 word2vec

利用语言相关性,相近或者相反
如下图:
king 与kings最相近,值也就越大,这个值是通过两个单词向量的cos夹角计算的(角越大值越小)
在这里插入图片描述

2.3 GloVe

下图是自己建立一个单词向量表,有两个单词索引是0和1,然后使用torch.nn.Embedding(2, 5)生成单词向量表,即2个单词,每个单词用5个dimension vector表示。
在这里插入图片描述
torch.nn.Embedding(2, 5)生成的词向量表,采用随机值进行初始化,这种随机值初始化后的向量值,并不能反映特定单词与单词之间的余弦距离以及不同单词之间的相关性。而且还需要根据特定的文本对其进行训练,以符合特定业务场景的需求。
Glove是预定义的,他人已经根据大量的文本数据训练好的数据集,可以直接使用,一般不需要自己修改。

glove使用见下图:
在这里插入图片描述


http://www.niftyadmin.cn/n/5536452.html

相关文章

[java]windows下jdk安装包所有版本系列下载地址汇总国内源下载

jdk1.8及其以前版本可以参考[java]windows和linux下jdk1.8安装包所有版本系列下载地址汇总,这里只发布jdk9及其以后最新版本。注意下面均为windows x64版本安装包exe格式 序号java版本下载地址1jdk-22.0.1-windows-x64-bin.exe点我下载2jdk-21.0.3-windows-x64-bin…

Kafka系列之SpringBoot集成Kafka

本文介绍如何在springboot项目中集成kafka收发message。 pom依赖 springboot相关的依赖我们就不提了&#xff0c;和kafka相关的只依赖一个spring-kafka集成包 <dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka<…

数据赋能(138)——开发:数据映射——技术方法、主要工具

技术方法 数据映射的技术方法主要包括以下几种&#xff1a; 手工法&#xff1a; 手工法涉及开发人员手动编码数据源和目标架构之间的链接。这通常使用如XSLT这样的计算机语言来编写代码&#xff0c;将XML文档翻译成各种格式。然而&#xff0c;随着数据系统的扩展和复杂化&…

探讨SpringMVC的工作原理

SpringMVC是Spring框架的一部分&#xff0c;是用于构建Web应用程序的一个模块。SpringMVC遵循Model-View-Controller&#xff08;MVC&#xff09;设计模式&#xff0c;帮助开发者将应用程序的业务逻辑、控制逻辑和表示层分离。以下是SpringMVC的工作原理及其核心组件的详细介绍…

大量数据渲染怎么优化速度

1. 分页加载 将数据分成若干份&#xff0c;每次请求当前页数据&#xff0c;在触底加载更多或者点击分页时加载下一页数据。 2. 虚拟列表 只渲染当前视口的数据&#xff0c;当用户滚动时动态更新视口里的内容&#xff0c;并不是一次渲染整个列表&#xff0c;这个方法比较适用…

dolphinscheduler-笔记1

后端搭建开发环境 一. 基础插件 maven&#xff08;3.9.7&#xff09; maven必须升级到3.9.x版本&#xff0c;不然打包会异常jdk&#xff08;1.8&#xff09;zookeeper&#xff08;3.8.4&#xff09;mysql或者pg&#xff08;使用mysql&#xff09; 二. 代码修改点 链接&…

RKNN3588——YOLOv8的PT模型转RKNN模型

一&#xff1a;PT转ONNX 1. 首先克隆rknn修改后的ultralytics版本项目到本地 https://github.com/airockchip/ultralytics_yolov8 cd ultralytics-main pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple pip install -e . 主要是修改了源码的ul…

记一次kafka使用不当导致的服务器异常

一、背景 1.运维反馈服务器cpu高&#xff0c;且高达80% 2.经过排查发现kafka出现消息积压情况 3.使用的是springboot kafka框架 dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactId> </dependency…