dataCreating/bin/faker_data.py

#encoding=utf-8
import csv
from faker import Faker

"""
生成尽可能真实的假数据

使用方法：
1.安装依赖包
    pip install faker
2.执行脚本
    python faker_data.py
3.当前目录，查看生成的数据
"""

#保存为csv文件
def save_data_csv(file_name,lines=100):
    #获取数据
    datas = faker_data(lines)
    #保存
    with open(file_name,'w+',encoding='utf-8',newline='') as file_csv:
        writer = csv.writer(file_csv, delimiter=',', quotechar='"', quoting=csv.QUOTE_ALL)
        writer.writerows(datas)

#生成数据
def faker_data(lines=10):
    #指定数据的国家地区
    f = Faker('zh-CN')
    #定义一个列表，用来存放所有数据
    datas = []
    #标题
    title = ["uuid","id","name","mobile","ssn","sex","email","job","address","actime_time"]
    #title2 = ["唯一标识","编号","姓名","手机号","身份证号","性别","邮箱","职业","家庭地址","获取时间"]
    #添加标题到列表中
    datas.append(title)
    #datas.append(title2)
    #开始按照标题的顺序，生成5w条数据
    for i in range(0,lines):
        #定义一个列表，用来存一行数据
        data = []
        #uuid
        data.append(f.uuid4())
        #编号，001，不足3位的左边用0来补齐
        data.append(str(i+1).rjust(3,'0'))
        #姓名
        data.append(f.name())
        #手机号
        data.append(f.phone_number())
        #身份证
        ssn = f.ssn()
        data.append(ssn)
        #性别，根据身份证的第17位来判断
        ssn_sex = int(ssn[16:17])
        #01：男，02：女
        if ssn_sex % 2:
            sex = "01"
        else:
            sex = "02"
        data.append(sex)
        #邮箱
        data.append(f.email())
        #职业
        data.append(f.job())
        #地址，让其更加复合中国的地址
        address = f.address()[:-9] + str(f.pyint(min_value=0, max_value=999))+ "号"
        data.append(address)
        #获取时间，近3年的
        actime_time = f.date_time_between(start_date="-3y", end_date="now")
        data.append(actime_time)
        #将这一行数据添加到datas中
        datas.append(data)
    #返回所有的数据
    return datas


if __name__ == '__main__':
    #文件名
    file_name = 'test.csv'
    save_data_csv(file_name)