ちょっとやってみた。
一応本家から落としてきた2.4.3でそのまま処理できるようだが、
cp932とshift-jisどちらが適切なのだろう...
http://cjkpython.berlios.de/
>>> print len(u'あいうえお') 10 >>> ustr = unicode("あいうえお", "cp932") >>> print len(ustr) 5 >>> print len(unicode("あいうえお", "cp932")) 5 >>> print len(unicode("あいうえお", "shift-jis")) 5 >>> import urllib2 >>> for line in urllib2.urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'): if 'UTC' in line: print line <BR>Apr. 08, 09:07:54 UTC