首页 > 编程语言 > 详细

python strip_tags 支持保留指定标签

时间:2015-05-06 17:02:03      阅读:566      评论:0      收藏:0      [点我收藏+]
#coding:utf-8

import re

def strip_tags(string, allowed_tags=‘‘):
  if allowed_tags != ‘‘:
    # Get a list of all allowed tag names.
    allowed_tags = allowed_tags.split(‘,‘)
    allowed_tags_pattern = [‘</?‘+allowed_tag+‘[^>]*>‘ for allowed_tag in allowed_tags]
    all_tags = re.findall(r‘<[^>]+>‘, string, re.I)
    not_allowed_tags = []
    tmp = 0
    for tag in all_tags:
        for pattern in allowed_tags_pattern:
            rs = re.match(pattern,tag)
            if rs:
                tmp += 1
            else:
                tmp += 0
        if not tmp:
            not_allowed_tags.append(tag)
        tmp = 0
    for not_allowed_tag in not_allowed_tags:
        string = re.sub(re.escape(not_allowed_tag), ‘‘,string)
    print not_allowed_tags
  else:
    # If no allowed tags, remove all.
    string = re.sub(r‘<[^>]*?>‘, ‘‘, string)
 
  return string

  

python strip_tags 支持保留指定标签

原文:http://www.cnblogs.com/bushe/p/4482114.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!