博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python print 方法 打印 unicode 遇到的坑
阅读量:6543 次
发布时间:2019-06-24

本文共 635 字,大约阅读时间需要 2 分钟。

今天使用bs4 写爬虫(爬取baidu搜索url),遇到Unicode编码无法转正常字体,经过反复排查,发现python2.x版本中的print方法打印书写格式问题:

def get_maximum_pages(soup_content,link_re):    div=soup_content.find('div',id='wrapper').find('div',id='wrapper_wrapper').find('div',id='container').find('div',id='page')    a_list = div.find_all('a')    next_page = a_list[len(a_list)-1]    next_text = next_page.get_text()print("next_text:",next_page_text)   //此处无论怎么调试,都一直显示('next_text:', u'\u4e0b\u4e00\u9875>')

 

1、python2.x 中正确写法:   

      print "next_text:",next_page_text 

     或者

     print("next_text:"+next_page_text )

    错误格式:print("next_text:",next_page_text)

转载于:https://www.cnblogs.com/husbandmen/p/9701068.html

你可能感兴趣的文章
iOS学习之Objective-C 2.0 运行时系统编程
查看>>
Exchange2007-Exchange2010升级-06 数据库高可用组的创建
查看>>
phpHiveAdmin是如何通过Hive/Hadoop工作的
查看>>
双向链表内结点的删除(4)
查看>>
项目总结
查看>>
JSON字符串转成对象
查看>>
SaltStack 中ZMQ升级
查看>>
grep,egrep使用以及正则表达式的使用
查看>>
implode 和 explode
查看>>
gzip the js and css
查看>>
exchange 2013 提示“HTTP 500内部服务器错误”
查看>>
Linux运维学习笔记之一:运维的原则和学习方法
查看>>
怎样使用原型设计中的组件样式功能
查看>>
python threading
查看>>
谷安天下2013年6月CISA考前辅导 第一季
查看>>
ARM程序规范
查看>>
深深的爱,静静的想
查看>>
LNMP环境出现502 Bad Gateway报错
查看>>
我的友情链接
查看>>
Qt下的OpenGL 编程(8)文字、FPS、动画
查看>>