分词-Jieba分词DAG方法
分词是自然语言处理中最基础的任务之一,也是必须掌握的算法之一。
Pandas基础操作
Pandas基础操作
Pandas 是python的一个数据分析包,在做NLP任务时可以极大的提高我们的处理效率,所以需要一些入门的知识。
pandas读取csv文件
pandas读取csv文件使用函数read_csv,可以将csv文件读取为DataFrame。这里用示例详细演示。这里写一个csv文件,用作测试
12345678910with open("data/test_pandas_read.csv", 'w', encoding='utf-8') as fout: fout.write("姓名,性别,年龄\n") fout.write("张一,男,21\n") fout.write("张二,男,22\n") fout.write("张三,男,23\n") fout.write("张四,男,24\n") fout.write("张五,男,25\n") fout.write("张六,男,26\n") fout.write("张七,男,27\n") fout.write("张八,男,28\n")
123import pandas as pdtrain_data = pd.read_csv("data/test_pandas_read.csv")print(train_data)
123456789 姓名 性别 年龄0 张一 男 211 张二 男 222 张三 男 233 张四 男 244 张五 男 255 张六 男 2 ...
Python中Pop函数
Python中,pop操作常用作列表实现栈时的出栈操作。但在python中,字典也有内置的pop操作。本文对pop操作给一些列举。
字典类型pop
Python 字典 pop() 方法删除字典给定键 key 及对应的值,返回值为被删除的值。key 值必须给出。 否则,返回 default 值。
dict.pop(key)
12345test = {'name': 'heng', 'age': 30}result = test.pop('name')print("1",result)result = test.pop()print("2",result)
heng
列表类型pop
移除列表中的一个元素(默认最后一个元素),并且返回该元素的值, ,
list.pop(index=-1)
1234567test = ["heng1", "heng2", "heng3"]result = test.pop()print(result)print(test)result = test.pop(0)print(result)print(test)
heng3
['heng1', 'heng2']
heng1
['heng2']