首页 > 其他 > 详细

字符串、文件操作,英文词频统计预处理

时间:2019-03-06 23:13:13      阅读:195      评论:0      收藏:0      [点我收藏+]
作业要求来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2646
1.字符串操作:
解析身份证号:生日、性别、出生地等。
代码如下:
# # -*- coding: utf-8 -*-
import re
pattern = r"^[1-6]\d{5}[12]\d{3}(0[1-9]|1[12])(0[1-9]|1[0-9]|2[0-9]|3[01])\d{3}(\d|X|x)$"
ID = input("请输入身份证号:")
res = re.match(pattern,ID)
if res == None :
print("身份证号输入错误")4
else:
print("身份证号输入正确")
print(‘身份证号是:{}‘.format(ID))
year = ID[6:14]
print(‘出生年月为:{}‘.format(year))
sex = ID[17]
if int(sex) % 2 == 1:
print("性别:男")
else:
print("性别:女")

运行之后显示结果如下:

技术分享图片

凯撒密码编码与解码

def getTranslatedMessage(mode, message, key):
if mode[0] == ‘d‘:
key = -key
translated = ‘‘
for symbol in message:
if symbol.isalpha():
num = ord(symbol)
num += key
if symbol.isupper():
if num > ord(‘Z‘):
num -= 26
elif num < ord(‘A‘):
num += 26
elif symbol.islower():
if num > ord(‘z‘):
num -= 26
elif num < ord(‘a‘):
num += 26

translated += chr(num)
else:
translated += symbol
return translated

mode = getMode()
message = getMessage()
if mode[0] != ‘b‘:
key = getKey()

print(‘根据你的输入获得到的信息为:‘)
if mode[0] != ‘b‘:
print(getTranslatedMessage(mode, message, key))
运行之后显示结果如下:


网址观察与批量生成
代码如下:
import webbrowser as web   # 引入第三方库,并用as取别名web
url=‘http://news.gzcc.cn/html/xiaoyuanxinwen‘
web.open_new_tab(url)
for i in range(1,4):
url1=‘http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html‘.format(i)
print(url1)
web.open_new_tab(‘http://news.gzcc.cn/html/xiaoyuanxinwen/‘+str(i)+‘.html‘)

技术分享图片

 



2.英文词频统计预处理

  • 下载一首英文的歌词或文章或小说,保存为utf8文件。
  • 从文件读出字符串。
  • 将所有大写转换为小写
  • 将所有其他做分隔符(,.?!)替换为空格
  • 分隔出一个一个的单词
  • 并统计单词出现的次数。

 

text="Mr. Johnson had never been up in an aerophane before and he had read a lot about air accidents,"      " so one day when a friend offered to take him for a ride in his own small phane, "      "Mr. Johnson was very worried about accepting."      " Finally, however, his friend persuaded him that it was very safe, and Mr. Johnson boarded the plane."
print(text.lower())
str=", . ! ? - ‘ :"
for s in  str:
    text=text.replace(s,‘‘)
    print(text.split())
    print(text.count(‘you‘),text.count(‘her‘))

运行之后显示结果如下:

 

技术分享图片

字符串、文件操作,英文词频统计预处理

原文:https://www.cnblogs.com/068zhengda/p/10486263.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!