当前位置:网站首页>阿里天池学习赛 新闻文本分类
阿里天池学习赛 新闻文本分类
2022-08-11 05:13:00 【甜辣uu】
当时我的成绩 阿里天池
原始数据 训练的词向量 模型 代码都在下面这两个链接里 一个完整版 一个不完整版
链接:https://pan.baidu.com/s/1I8l-5f0-IlrSPa3aP6nY2A
提取码:1111
复制这段内容后打开百度网盘手机App,操作更方便哦
链接:https://pan.baidu.com/s/1XNaM7fc96aSBi-sML-_vEw
提取码:1111
复制这段内容后打开百度网盘手机App,操作更方便哦
from gensim.models import KeyedVectors
from gensim.scripts.glove2word2vec import glove2word2vec
import pandas as pd
import numpy as np
import torch
from torch import nn
import torch.utils.data as data
import torch.nn.functional as F
from torch import tensor
from sklearn.metrics import f1_score
from datetime import datetime
import time
#csv数据量的数目测试 一共有20000条
with open("train_set839.csv", 'r') as f: #计算长度
hang_count=len(f.readlines())
# print(hang_count)
#先把csv中一个句子拿出来 然后把每个单词去词训练库里面找对应的向量规定对于每个句子矩阵都构建一个2000,300的矩阵。
def hang_vectoes_label(index): # 要读取csv文本第几行的文章数据 会返回一个 列表里面是文章的词向量矩阵和标签值
row=df.va边栏推荐
猜你喜欢
随机推荐
C language antithesis: who is the murderer!
【ARM】rk3399挂载nfs报错
Paper Notes: Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks
K8s Review Notes 7--K8S Implementation of Redis Standalone and Redis-cluster
[Embedded open source library] The use of cJSON, an efficient and streamlined json parsing library
IDEA中配置checkstyle
[ARM] rk3399 mounts nfs error
批量修改数据库等视频文件名称
CentOS7静默安装Oracle11g_转载
Application layer protocol - DNS
ARM Architecture 4: Embedded Hardware Platform Interface Development
Thymeleaf
paddlepaddle implements CS_CE Loss and incorporates PaddleClas
将double类型的数据转为字符串
2021 Network Planning Designer Afternoon Case Questions
MyEclipse数据库工具使用教程:使用驱动程序
Idea提升工作效率的必备技巧
【嵌入式开源库】cJSON的使用,高效精简的json解析库
Switch and Router Technology-31-Extended ACL
Delphi7学习记录-demo实例









