間違いだらけの備忘録

このページの内容は無保証でありこのページの内容によって直接、または間接に損害を受けられたとしても私は責任を取りません。

日本語文字列

ちょっとやってみた。
一応本家から落としてきた2.4.3でそのまま処理できるようだが、
cp932とshift-jisどちらが適切なのだろう...
http://cjkpython.berlios.de/

>>> print len(u'あいうえお')
10
>>> ustr = unicode("あいうえお", "cp932")

>>> print len(ustr)
5
>>> print len(unicode("あいうえお", "cp932"))
5
>>> print len(unicode("あいうえお", "shift-jis"))
5
>>> import urllib2

>>> for line in urllib2.urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'):
	if 'UTC' in line:
		print line

		
<BR>Apr. 08, 09:07:54 UTC
このページにはhatena以外のサービスからのコンテンツが埋め込まれています。 hatenaによりGoogle AdSense 広告が埋め込まれています。