2014年4月22日星期二

今日学习笔记

关键词:
  • sqlite3 字符串变量
  • python编码 
1. 对于数据库中字符串变量的处理

sqlite3数据库中得字符串类型有以下几种
  • char 
  • varchar 
  • text 
  • nvarchar 
  • ntext

一般使用varchar来表达英文字母与数字

如果需要进行中英文混搭的话使用nvarchar或者ntext

text表示unicode字符串

nvarchar(n)最多可以显示n/2个中文字符

2. 对于读取数据库中字符串变量后 对其显示的处理
在python中的编码处理可以在文件开始使用#-*- utf-8 -*- 来进行硬处理。也可以在编程过程中使用encode/decode来进行人为的处理,也就是说,字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。
  1.     decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。 
  2.     encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。
需注意:代码中字符串的默认编码与代码文件本身的编码一致。

举例如下:

s=u'测试'为unicode编码,如果文件编码为utf-8则需直接将其转换(encode)为utf-8即可。

判断是否为unicode的函数,isinstance(s,unicode)