首页 > 编程语言 > 详细

python除去html标签

时间:2014-12-10 22:46:42      阅读:476      评论:0      收藏:0      [点我收藏+]

使用python自带的HTMLParser 实现。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2,re
import time,sys
from HTMLParser import HTMLParser
#设置默认编码
type = sys.getfilesystemencoding()

class MyHTMLParser(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)      

	
def main():
	parser = MyHTMLParser()
	parser.feed('<style type="text/css">#python { color: green }</style>')
	print parser.get_data().strip()
			
if __name__ == '__main__':
	main()
输出:

#python { color: green }

python除去html标签

原文:http://blog.csdn.net/xyw_blog/article/details/41854941

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!