<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Information Retrieval Blog &#187; Web</title>
	<atom:link href="http://blog.so8848.com/category/%e4%ba%92%e8%81%94%e7%bd%91%e8%a7%82%e5%af%9f/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.so8848.com</link>
	<description>REAL TIME DATA PROCESSING, DISTRIBUTED COMPUTING, PATTERN DISCOVERY</description>
	<lastBuildDate>Tue, 31 Jan 2012 02:05:19 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>汉字编码问题合集&#8211;整理</title>
		<link>http://blog.so8848.com/2011/09/3962.html</link>
		<comments>http://blog.so8848.com/2011/09/3962.html#comments</comments>
		<pubDate>Tue, 13 Sep 2011 04:52:19 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[编码]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/?p=3962</guid>
		<description><![CDATA[汉字编码问题 下面是搜集的多篇关于汉字编码问题文章的合集，相信你的问题一定包含在其中，如果没有请留言，一起把这方面的内容补充全。一、汉字编码的种类 汉字编码中现在主要用到的有三类，包括GBK，GB2312和Big5。 1、 GB2312又称国标码，由国家标准总局发布，1981年5月1日实施，通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范，当然也包括其他 的符号、字母、日文假名等，共7445个图形字符，其中汉字占6763个。我们平时说6768个汉字，实际上里边有5个编码为空白，所以总共有6763个 汉字。 GB2312规定&#8221;对任意一个图形字符都采用两个字节表示，每个字节均采用七位编码表示&#8221;，习惯上称第一个字节为&#8221;高字节&#8221;，第二个字节 为&#8221;低字节&#8221;。GB2312中汉字的编码范围为，第一字节0xB0-0xF7(对应十进制为176-247)，第二个字节0xA0-0xFE（对应十进制 为160-254）。 GB2312将代码表分为94个区，对应第一字节（0xa1-0xfe）；每个区94个位（0xa1-0xfe），对应第二 字节，两个字节的值分别为区号值和位号值加32（2OH），因此也称为区位码。01-09区为符号、数字区，16-87区为汉字区（0xb0- 0xf7），10-15区、88-94区是有待进一步标准化的空白区。 2、Big5又称大五码，主要为香港与台湾使用，即是一个繁体字编码。每个 汉字由两个字节构成，第一个字节的范围从0X81－0XFE（即129-255），共126种。第二个字节的范围不连续，分别为0X40－0X7E（即 64-126），0XA1－0XFE（即161-254），共157种。 3、GBK是GB2312的扩展，是向上兼容的，因此 GB2312 中的汉字的编码与GBK中汉字的相同。另外，GBK中还包含繁体字的编码，它与Big5编码之间的关系我还没有弄明白，好像是不一致的。GBK中每个汉字 仍然包含两个字节，第一个字节的范围是0&#215;81-0xFE（即129-254），第二个字节的范围是0&#215;40-0xFE（即64-254）。GBK中有码 位23940个，包含汉字21003个。 表1 汉字编码范围 名称    &#124;       第一字节          &#124;           第二字节 &#8212;&#8212;&#8211;&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; GB2312  &#124;   0xB0-0xF7(176-247)    &#124;    0xA0-0xFE（160-254） &#8212;&#8212;&#8211;&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;- GBK0    &#124;  x81-0xFE（129-254）    &#124;   0&#215;40-0xFE（64-254） &#8212;&#8212;&#8211;&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;- Big5    &#124;   0&#215;81-0xFE（129-255）  &#124;   0&#215;40-0x7E（64-126）， &#124;                         &#124;    0xA1－0xFE（161-254） &#8212;&#8212;&#8211;&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-&#124;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 二、对汉字进行hash 为了处理汉字的方便，在查找汉字的时候，我们通常会用到hash的方法，那怎么来确定一个汉字位置呢？这就和每种编码的排列有关了，这里主要给出一种hash函数的策略。 对于GB2312编码，设输入的汉字为GBword，我们可以采用公式(C1-176)*94 + (C2-161)确定GBindex。其中，C1表示第一字节，C2表示第二字节。具体如下： <a href='http://blog.so8848.com/2011/09/3962.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<h3 class="post-title entry-title"><a href="http://gblog.5yiso.cn/2007/11/blog-post_09.html"><br />
</a></h3>
<p><span style="font-family: Verdana;"><span style="font-size: x-small;">汉字编码问题<br />
下面是搜集的多篇关于汉字编码问题文章的合集，相信你的问题一定包含在其中，如果没有请留言，一起把这方面的内容补充全。</span></span><span style="font-family: Verdana;"><span style="font-size: x-small;">一、汉字编码的种类<br />
汉字编码中现在主要用到的有三类，包括GBK，GB2312和Big5。<br />
1、 GB2312又称国标码，由国家标准总局发布，1981年5月1日实施，通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范，当然也包括其他 的符号、字母、日文假名等，共7445个图形字符，其中汉字占6763个。我们平时说6768个汉字，实际上里边有5个编码为空白，所以总共有6763个 汉字。<br />
GB2312规定&#8221;对任意一个图形字符都采用两个字节表示，每个字节均采用七位编码表示&#8221;，习惯上称第一个字节为&#8221;高字节&#8221;，第二个字节 为&#8221;低字节&#8221;。GB2312中汉字的编码范围为，第一字节0xB0-0xF7(对应十进制为176-247)，第二个字节0xA0-0xFE（对应十进制 为160-254）。<br />
GB2312将代码表分为94个区，对应第一字节（0xa1-0xfe）；每个区94个位（0xa1-0xfe），对应第二 字节，两个字节的值分别为区号值和位号值加32（2OH），因此也称为区位码。01-09区为符号、数字区，16-87区为汉字区（0xb0- 0xf7），10-15区、88-94区是有待进一步标准化的空白区。<br />
2、Big5又称大五码，主要为香港与台湾使用，即是一个繁体字编码。每个 汉字由两个字节构成，第一个字节的范围从0X81－0XFE（即129-255），共126种。第二个字节的范围不连续，分别为0X40－0X7E（即 64-126），0XA1－0XFE（即161-254），共157种。</span></span></p>
<p>3、GBK是GB2312的扩展，是向上兼容的，因此 GB2312 中的汉字的编码与GBK中汉字的相同。另外，GBK中还包含繁体字的编码，它与Big5编码之间的关系我还没有弄明白，好像是不一致的。GBK中每个汉字 仍然包含两个字节，第一个字节的范围是0&#215;81-0xFE（即129-254），第二个字节的范围是0&#215;40-0xFE（即64-254）。GBK中有码 位23940个，包含汉字21003个。</p>
<p>表1 汉字编码范围</p>
<p>名称    |       第一字节          |           第二字节<br />
&#8212;&#8212;&#8211;|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
GB2312  |   0xB0-0xF7(176-247)    |    0xA0-0xFE（160-254）<br />
&#8212;&#8212;&#8211;|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
GBK0    |  x81-0xFE（129-254）    |   0&#215;40-0xFE（64-254）<br />
&#8212;&#8212;&#8211;|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
Big5    |   0&#215;81-0xFE（129-255）  |   0&#215;40-0x7E（64-126），<br />
|                         |    0xA1－0xFE（161-254）<br />
&#8212;&#8212;&#8211;|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-|&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
二、对汉字进行hash<br />
为了处理汉字的方便，在查找汉字的时候，我们通常会用到hash的方法，那怎么来确定一个汉字位置呢？这就和每种编码的排列有关了，这里主要给出一种hash函数的策略。<br />
对于GB2312编码，设输入的汉字为GBword，我们可以采用公式(C1-176)*94 + (C2-161)确定GBindex。其中，C1表示第一字节，C2表示第二字节。具体如下：<br />
GBindex = ((unsigned char)GBword.at(0)-176)*94 + (unsigned char)GBword.at(1) &#8211; 161;<br />
之所以用unsigned char类型，是因为char是一个字节，如果用unsigend int，因为int是4个字节的，所以会造成扩展，导致错误。<br />
对于GBK编码，设输入的汉字为GBKword，则可以采用公式   index=(ch1-0&#215;81)*190+(ch2-0&#215;40)-(ch2/128)，其中ch1是第一字节，ch2是第二字节。<br />
具体的，<br />
GBKindex = ((unsigned char)GBKword[0]-129)*190 +<br />
((unsigned char)GBKword[1]-64) &#8211; (unsigned char)GBKword[1]/128;</p>
<p>三、怎样判断一个汉字的是什么编码<br />
直接根据汉字的编码范围判断，对于GB2312和GBK可用下面两个程序实现。<br />
1、判断是否是GB2312<br />
bool isGBCode(const string&amp; strIn)<br />
{<br />
unsigned char ch1;<br />
unsigned char ch2;</p>
<p>if (strIn.size() &gt;= 2)<br />
{<br />
ch1 = (unsigned char)strIn.at(0);<br />
ch2 = (unsigned char)strIn.at(1);<br />
if (ch1&gt;=176 &amp;&amp; ch1&lt;=247 &amp;&amp;ch2&gt;=160 &amp;&amp; ch2&lt;=254)<br />
return true;<br />
else return false;<br />
}<br />
else return false;<br />
}<br />
2、判断是否是GBK编码<br />
bool isGBKCode(const string&amp; strIn)<br />
{<br />
unsigned char ch1;<br />
unsigned char ch2;</p>
<p>if (strIn.size() &gt;= 2)<br />
{<br />
ch1 = (unsigned char)strIn.at(0);<br />
ch2 = (unsigned char)strIn.at(1);<br />
if (ch1&gt;=129 &amp;&amp; ch1&lt;=254 &amp;&amp;ch2&gt;=64 &amp;&amp; ch2&lt;=254)<br />
return true;<br />
else return false;<br />
}<br />
else return false;<br />
}</p>
<p>3、对于Big5<br />
它 的范围为：高字节从0xA0到0xFE，低字节从0&#215;40到0x7E，和0xA1到0xFE两部分。判断一个汉字是否是BIG5编码，可以如上对字符的编 码范围判断即可。如何定位呢？那么也想象所有编码排列为一个二维坐标，纵坐标是高字节，横坐标是低字节。这样一行上的汉字个数：(0x7E-0&#215;40+ 1)+(0xFE-0xA1+1)＝157。那么定位算法分两块，为:</p>
<p>if 0&#215;40&lt;=ch2&lt;=0x7E: #is big5 char<br />
index=((ch1-0xA1)*157+(ch2-0&#215;40))*2<br />
elif 0xA1&lt;=ch2&lt;=0xFE: #is big5 char<br />
index=((ch1-0xA1)*157+(ch2-0xA1+63))*2</p>
<p>对于第二块，计算偏移量时因为有两块数值，所以在计算后面一段值时，不要忘了前面还有一段值。0x7E-0&#215;40+1=63。</p>
<p>四、如果判断一个字符是西文字符还是中文字符<br />
大家知道西文字符主要是指ASCII码，它用一个字节表示。且这个字符转换成数字之后，该数字是大于0的，而汉字是两个字节的，第一个字节的转化为数字之后应该是小于0的，因此可以根据每个字节转化为数字之后是否小于0，判断它是否是汉字。<br />
例如，设输入字为strin，则，<br />
If (strin.at(0) &lt; 0)<br />
cout &lt;&lt; &#8220;是汉字&#8221; &lt;&lt; endl;<br />
else cout &lt;&lt; &#8220;不是汉字&#8221; &lt;&lt; endl;<br />
五、下载GBK编码表（见附件）<br />
下载GB2312编码表见下面的回帖</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
另一些与编码相关的文章：<br />
1、GB码和BIG5码的互换技术<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-<br />
中文与英文用ASCII码一个字节表示不同，它使用两个字节来表示。事实上，在文本文件中保存的就是每个汉字对应的两个字节编码，而显示问题由中文操作系统自动解决。<br />
汉字编码并不统一，我们使用的是GB码，而台湾地区使用的是BIG5码。BIG5码文件中保存的是汉字相应的BIG5编码，GB码文件中保存的是汉字相应的GB编码。所以转换工作的关键是有一个记录每个BIG5编码对应GB编码的码表文件。<br />
GB码编码规则是这样的：每个汉字由两个字节构成，第一个字节的范围从0XA1－0XFE，共96种。第二个字节的范围分别为0XA1－0XFE，共96种。利用这两个字节共可定义出 96 * 96＝8836种汉字。实际共有6763个汉字。<br />
BIG5码编码规则是这样的：每个汉字由两个字节构成，第一个字节的范围从0X81－0XFE，共126种。第二个字节的范围分别为0X40－0X7E， 0XA1－0XFE，共157种。也就是说，利用这两个字节共可定义出 126 * 157＝19782种汉字。这些汉字的一部分是我们常用到的，如一、丁，这些字我们称为常用字，其BIG5码的范围为0XA440－0XC671，共 5401个。较不常用的字，如滥、调，我们称为次常用字，范围为 0XC940－0XF9FE，共7652个，剩下的便是一些特殊字符。<br />
制作码表文件的原理是这样的：首先将所有的GB编码写入一个文件，然后，使用具有GB码到BIG5码转换功能的软件，如UCDOS下的CONVERT.EXE，将文件转换为BIG5码文件，即得到码表文件。<br />
下面的程序可将全部国标码写入文件gb.txt(以下全部程序用foxpro书写，可很容易的转换成其他语言)<br />
fp = fopen(&#8220;gb.txt&#8221;,2)<br />
for i=161 to 247<br />
for j=161 to 254<br />
=fwrite(fp,chr(i)+chr(j))<br />
next<br />
=fwrite(fp,chr(13)+chr(10))<br />
next<br />
=fwrite(fp,chr(26))<br />
=fclose(fp)</p>
<p>文件的组织形式：行对应编码的第一字节，列对应编码的第二字节。使用时请注意编码的偏移量，如汉字&#8221;啊&#8221;GB编码0xb1a1第一字节0xb1(177) 第二字节0xa1(161)所以他应该在文件的第(177-161=16)行第((161-161)*2=0)列。<br />
运行CONVERT.EXE将gb.txt转换成BIG5码的文件，这样就可得到按GB码组织的BIG5码表文件big5.txt。反之亦可得到按BIG5码组织的GB码表文件。</p>
<p>转换的思路是这样的：(用foxpro书写)<br />
首先将码表文件装入数组<br />
fp = fopen(&#8220;big5.txt&#8221;)<br />
i = 0<br />
do while feof(fp)<br />
i = i+1<br />
dime dict<br />
dict = fgets(fp)<br />
enddo<br />
=fclose(fp)<br />
其次将待转换的文本装入变量<br />
create cursor temp (mm m)<br />
append blank<br />
append memo mm from textfilename<br />
text = mm<br />
然后扫描文本，替换所有的GB编码<br />
temp = &#8220;&#8221;<br />
i = 1<br />
do while i &lt; len(text)<br />
ch = substr(text,i,1)<br />
if isascii(ch)   &amp;&amp; 若是ASCII码<br />
temp = temp+ch<br />
i = i+1<br />
else<br />
ch1 = substr(text,i+1,1)<br />
big5 = substr(dict[asc(ch)-161+1],(asc(ch1)-161)*2+1,2)<br />
temp = temp+big5<br />
i = i+2<br />
endif<br />
enddo<br />
最后将在temp中得到转换后的文本</p>
<p>需要注意的是，在foxpro中数组指针是以1开始，substr函数的起始位&gt;=1。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
一、GB2312-80介绍<br />
GB2312码是中华人民共和国国家汉字信息交换用编码，全称《信息交换用汉字编码字符集&#8211;基本集》，由国家标准总局发布，1981年5月1日实施，通行于大陆。新加坡等地也使用此编码。<br />
GB2312 收录简化汉字及符号、字母、日文假名等共7445个图形字符，其中汉字占6763个。GB2312规定&#8221;对任意一个图形字符都采用两个字节表示，每个字节 均采用七位编码表示&#8221;，习惯上称第一个字节为&#8221;高字节&#8221;，第二个字节为&#8221;低字节&#8221;。GB2312-80包含了大部分常用的一、二级汉字，和9区的符号。该 字符集是几乎所有的中文系统和国际化的软件都支持的中文字符集，这也是最基本的中文字符集。其编码范围是高位0xa1－0xfe，低位也是0xa1- 0xfe；汉字从0xb0a1开始，结束于0xf7fe。<br />
GB2312将代码表分为94个区，对应第一字节（0xa1-0xfe）；每个区94个 位（0xa1-0xfe），对应第二字节，两个字节的值分别为区号值和位号值加32（2OH），因此也称为区位码。01-09区为符号、数字区，16- 87区为汉字区（0xb0-0xf7），10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级：第一级是常用汉字计 3755个，置于16-55区，按汉语拼音字母/笔形顺序排列；第二级汉字是次常用汉字计3008个，置于56-87区，按部首/笔画顺序排列。故而 GB2312最多能表示6763个汉字。<br />
GB2312的编码范围为2121H-777EH，与ASCII有重叠，通行方法是将GB码两个字节的最高位置1以示区别。<br />
二、GB2312-80的扩展</p>
<p>GBK是GB2312-80的扩展，是向上兼容的。它包含了20902个汉字，其编码范围是0&#215;8140-0xfefe，剔除高位0&#215;80的字位。其所有字符都可以一对一映射到Unicode2.0。<br />
GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字，增加了藏、蒙等少数民族的字形。GBK2K从根本上解决了字位不够，字形不足的问题。它有几个特点：<br />
它并没有确定所有的字形，只是规定了编码范围，留待以后扩充。<br />
编码是变长的，其二字节部分与GBK兼容；四字节部分是扩充的字形、字位，其编码范围是首字节0&#215;81-0xfe、二字节0&#215;30-0&#215;39、三字节0&#215;81-0xfe、四字节0&#215;30-0&#215;39。<br />
它的推广是分阶段的，首先要求实现的是能够完全映射到Unicode3.0标准的所有字形。<br />
它是国家标准，是强制性的。<br />
现在还没有任何一个操作系统或软件实现了GBK2K的支持，这是现阶段和将来汉化的工作内容。</p>
<p>三、Unicode编码</p>
<p>国 际标准组织于1984年4月成立ISO/IECJTC1/SC2/WG2工作组，针对各国文字、符号进行统一性编码。1991年美国跨国公司成立 UnicodeConsortium，并于1991年10月与WG2达成协议，采用同一编码字集。目前Unicode是采用16位编码体系，其字符集内容 与ISO10646的BMP（BasicMultilingualPlane）相同。Unicode于1992年6月通过DIS （DrafInternationalStandard），目前版本V2.0于1996公布，内容包含符号6811个，汉字20902个，韩文拼音 11172个，造字区6400个，保留20249个，共计65534个。<br />
随着国际互联网的迅速发展，要求进行数据交换的需求越来越大，不同的编码体系越来越成为信息交换的障碍，而且多种语言共存的文档不断增多，单靠代码页已很难解决这些问题，于是UNICODE应运而生。<br />
UNICODE 有双重含义，首先UNICODE是对国际标准ISO/IEC10646编码的一种称谓（ISO/IEC10646是一个国际标准，亦称大字符集，它是 ISO于1993年颁布的一项重要国际标准，其宗旨是全球所有文种统一编码），另外它又是由美国的HP、Microsoft、IBM、Apple等大企业 组成的联盟集团的名称，成立该集团的宗旨就是要推进多文种的统一编码。<br />
UNICODE同现在流行的代码页最显著不同点在于：UNICODE是两字 节的全编码，对于ASCII字符它也使用两字节表示。代码页是通过高字节的取值范围来确定是ASCII字符，还是汉字的高字节。如果发生数据损坏，某处内 容破坏，则会引起其后汉字的混乱。UNICODE则一律使用两个字节表示一个字符，最明显的好处是它简化了汉字的处理过程。<br />
UNICODE使用平面来描述编码空间，每个平面分为256行，256列，相对于两字节编码的高低两个字节。<br />
UNICODE的第一个平面，称为BasicMultilingualPlane（基本多文种平面），简称BMP，由于BMP仅用两个字节表示，所以倍受青睐。</p>
<p>一些相关的网页：<br />
GBK代码表： <a href="http://www.haiyan.com/steelk/navigator/ref/gbk/gbindex2.htm">http://www.haiyan.com/steelk/navigator/ref/gbk/gbindex2.htm</a><br />
GBK 汉字内码扩展规范：<a href="http://www.haizhuedu.net/no-weiyischool/hzdwzx/xxzy/xxzy-kj/xxzy-xx/xkjs2-8/HAIZI/GBK.htm">http://www.haizhuedu.net/no-weiyischool/hzdwzx/xxzy/xxzy-kj/xxzy-xx/xkjs2-8/HAIZI/GBK.htm</a><br />
下载GB2312编码表，见附件<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
谈谈Unicode编码，简要解释UCS、UTF、BMP、BOM等名词<br />
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念，增进知识，类似于打RPG游戏的升级。整理这篇文章的动机是两个问题：<br />
问题一：<br />
使用Windows记事本的&#8221;另存为&#8221;，可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件，Windows是怎样识别编码方式的呢？</p>
<p>我 很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节，分别是FF、FE（Unicode）,FE、FF（Unicode big endian）,EF、BB、BF（UTF-8）。但这些标记是基于什么标准呢？</p>
<p>问题二：<br />
最近在网上看到一个 ConvertUTF.c，实现了UTF-32、UTF-16和UTF-8这三种编码方式的相互转换。对于Unicode(UCS2)、GBK、UTF- 8这些编码方式，我原来就了解。但这个程序让我有些糊涂，想不起来UTF-16和UCS2有什么关系。<br />
查了查相关资料，总算将这些问题弄清楚了，顺带也了解了一些Unicode的细节。写成一篇文章，送给有过类似疑问的朋友。本文在写作时尽量做到通俗易懂，但要求读者知道什么是字节，什么是十六进制。</p>
<p>0、big endian和little endian<br />
big endian和little endian是CPU处理多字节数的不同方式。例如&#8221;汉&#8221;字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前 面？如果将6C写在前面，就是big endian。如果将49写在前面，就是little endian。</p>
<p>&#8220;endian&#8221;这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开，由此曾发生过六次叛乱，一个皇帝送了命，另一个丢了王位。</p>
<p>我们一般将endian翻译成&#8221;字节序&#8221;，将big endian和little endian称作&#8221;大尾&#8221;和&#8221;小尾&#8221;。</p>
<p>1、字符编码、内码，顺带介绍汉字编码<br />
字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码，为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。</p>
<p>GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。</p>
<p>GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。</p>
<p>从ASCII、 GB2312到GBK，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以 统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK都属于双字节字符集 (DBCS)。</p>
<p>2000 年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。从汉字字 汇上说，GB18030在GB13000.1的20902个汉字的基础上增加了CJK扩展A的6582个汉字（Unicode码0&#215;3400- 0x4db5），一共收录了27484个汉字。</p>
<p>CJK就是中日韩的意思。Unicode为了节省码位，将中日韩三国语言中的文字统一编码。GB13000.1就是ISO/IEC 10646-1的中文版，相当于Unicode 1.1。</p>
<p>GB18030 的编码采用单字节、双字节和4字节方案。其中单字节、双字节和GBK是完全兼容的。4字节编码的码位就是收录了CJK扩展A的6582个汉字。例如： UCS的0&#215;3400在GB18030中的编码应该是8139EF30，UCS的0&#215;3401在GB18030中的编码应该是8139EF31。</p>
<p>微软提供了GB18030的升级包，但这个升级包只是提供了一套支持CJK扩展A的6582个汉字的新字体：新宋体-18030，并不改变内码。Windows 的内码仍然是GBK。</p>
<p>这里还有一些细节：</p>
<p>GB2312的原文还是区位码，从区位码到内码，需要在高字节和低字节上分别加上A0。</p>
<p>对 于任何字符编码，编码单元的顺序是由编码方案指定的，与endian无关。例如GBK的编码单元是字节，用两个字节表示一个汉字。这两个字节的顺序是固定 的，不受CPU字节序的影响。UTF-16的编码单元是word（双字节），word之间的顺序是编码方案指定的，word内部的字节排列才会受到 endian的影响。后面还会介绍UTF-16。</p>
<p>GB2312的两个字节的最高位都是1。但符合这个条件的码位只有 128*128=16384个。所以GBK和GB18030的低字节最高位都可能不是1。不过这不影响DBCS字符流的解析：在读取DBCS字符流时，只 要遇到高位为1的字节，就可以将下两个字节作为一个双字节编码，而不用管低字节的高位是什么。</p>
<p>2、Unicode、UCS和UTF<br />
前面提到从ASCII、GB2312、GBK到GB18030的编码方法是向下兼容的。而Unicode只与ASCII兼容（更准确地说，是与ISO-8859-1兼容），与GB码不兼容。例如&#8221;汉&#8221;字的Unicode编码是6C49，而GB码是BABA。</p>
<p>Unicode 也是一种字符编码方法，不过它是由国际组织设计，可以容纳全世界所有语言文字的编码方案。Unicode的学名是&#8221;Universal Multiple-Octet Coded Character Set&#8221;，简称为UCS。UCS可以看作是&#8221;Unicode Character Set&#8221;的缩写。</p>
<p>根据维基百科全书(<a href="http://zh.wikipedia.org/wiki/">http://zh.wikipedia.org/wiki/</a>)的记载：历史上存在两个试图独立设计Unicode的组织，即国际标准化组织（ISO）和一个软件制造商的协会（unicode.org）。ISO开发了ISO 10646项目，Unicode协会开发了Unicode项目。</p>
<p>在1991年前后，双方都认识到世界不需要两个不兼容的字符集。于是它们开始合并双方的工作成果，并为创立一个单一编码表而协同工作。从Unicode2.0开始，Unicode项目采用了与ISO 10646-1相同的字库和字码。</p>
<p>目前两个项目仍都存在，并独立地公布各自的标准。Unicode协会现在的最新版本是2005年的Unicode 4.1.0。ISO的最新标准是ISO 10646-3:2003。</p>
<p>UCS 只是规定如何编码，并没有规定如何传输、保存这个编码。例如&#8221;汉&#8221;字的UCS编码是6C49，我可以用4个ascii数字来传输、保存这个编码；也可以用 utf-8编码:3个连续的字节E6 B1 89来表示它。关键在于通信双方都要认可。UTF-8、UTF-7、UTF-16都是被广泛接受的方案。UTF-8的一个特别的好处是它与ISO- 8859-1完全兼容。UTF是&#8221;UCS Transformation format&#8221;的缩写。</p>
<p>IETF的RFC2781和 RFC3629以RFC的一贯风格，清晰、明快又不失严谨地描述了UTF-16和UTF-8的编码方法。我总是记不得IETF是Internet Engineering Task Force的缩写。但IETF负责维护的RFC是Internet上一切规范的基础。</p>
<p>2.1、内码和code page<br />
目前Windows的内核已经支持Unicode字符集，这样在内核上可以支持全世界所有的语言文字。但是由于现有的大量程序和文档都采用了某种特定语言的编码，例如GBK，Windows不可能不支持现有的编码，而全部改用Unicode。</p>
<p>Windows使用代码页(code page)来适应各个国家和地区。code page可以被理解为前面提到的内码。GBK对应的code page是CP936。</p>
<p>微软也为GB18030定义了code page：CP54936。但是由于GB18030有一部分4字节编码，而Windows的代码页只支持单字节和双字节编码，所以这个code page是无法真正使用的。</p>
<p>3、UCS-2、UCS-4、BMP<br />
UCS有两种格式：UCS-2和UCS-4。顾名思义，UCS-2就是用两个字节编码，UCS-4就是用4个字节（实际上只用了31位，最高位必须为0）编码。下面让我们做一些简单的数学游戏：</p>
<p>UCS-2有2^16=65536个码位，UCS-4有2^31=2147483648个码位。</p>
<p>UCS -4根据最高位为0的最高字节分成2^7=128个group。每个group再根据次高字节分为256个plane。每个plane根据第3个字节分为 256行 (rows)，每行包含256个cells。当然同一行的cells只是最后一个字节不同，其余都相同。</p>
<p>group 0的plane 0被称作Basic Multilingual Plane, 即BMP。或者说UCS-4中，高两个字节为0的码位被称作BMP。</p>
<p>将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。在UCS-2的两个字节前加上两个零字节，就得到了UCS-4的BMP。而目前的UCS-4规范中还没有任何字符被分配在BMP之外。</p>
<p>4、UTF编码</p>
<p>UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下：</p>
<p>UCS-2编码(16进制) UTF-8 字节流(二进制)<br />
0000 &#8211; 007F 0xxxxxxx<br />
0080 &#8211; 07FF 110xxxxx 10xxxxxx<br />
0800 &#8211; FFFF 1110xxxx 10xxxxxx 10xxxxxx</p>
<p>例 如&#8221;汉&#8221;字的Unicode编码是6C49。6C49在0800-FFFF之间，所以肯定要用3字节模板了：1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是：0110 110001 001001， 用这个比特流依次代替模板中的x，得到：11100110 10110001 10001001，即E6 B1 89。</p>
<p>读者可以用记事本测试一下我们的编码是否正确。需要注意，UltraEdit在打开utf-8编码的文本文件时会自动转换为UTF-16，可能产生混淆。你可以在设置中关掉这个选项。更好的工具是Hex Workshop。</p>
<p>UTF -16以16位为单元对UCS进行编码。对于小于0&#215;10000的UCS码，UTF-16编码就等于UCS码对应的16位无符号整数。对于不小于 0&#215;10000的UCS码，定义了一个算法。不过由于实际使用的UCS2，或者UCS4的BMP必然小于0&#215;10000，所以就目前而言，可以认为UTF -16和UCS-2基本相同。但UCS-2只是一个编码方案，UTF-16却要用于实际的传输，所以就不得不考虑字节序的问题。</p>
<p>5、UTF的字节序和BOM<br />
UTF -8以字节为编码单元，没有字节序的问题。UTF-16以两个字节为编码单元，在解释一个UTF-16文本前，首先要弄清楚每个编码单元的字节序。例如 &#8220;奎&#8221;的Unicode编码是594E，&#8221;乙&#8221;的Unicode编码是4E59。如果我们收到UTF-16字节流&#8221;594E&#8221;，那么这是&#8221;奎&#8221;还是 &#8220;乙&#8221;？</p>
<p>Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是&#8221;Bill Of Material&#8221;的BOM表，而是Byte Order Mark。BOM是一个有点小聪明的想法：</p>
<p>在UCS 编码中有一个叫做&#8221;ZERO WIDTH NO-BREAK SPACE&#8221;的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输 字符&#8221;ZERO WIDTH NO-BREAK SPACE&#8221;。</p>
<p>这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。因此字符&#8221;ZERO WIDTH NO-BREAK SPACE&#8221;又被称作BOM。</p>
<p>UTF -8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符&#8221;ZERO WIDTH NO-BREAK SPACE&#8221;的UTF-8编码是EF BB BF（读者可以用我们前面介绍的编码方法验证一下）。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。</p>
<p>Windows就是使用BOM来标记文本文件的编码方式的。</p>
<p>6、进一步的参考资料<br />
本文主要参考的资料是 &#8220;Short overview of ISO-IEC 10646 and Unicode&#8221; (<a href="http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html">http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html</a>)。</p>
<p>我还找了两篇看上去不错的资料，不过因为我开始的疑问都找到了答案，所以就没有看：</p>
<p>&#8220;Understanding Unicode A general introduction to the Unicode Standard&#8221; (<a href="http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter04a">http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter04a</a>)<br />
&#8220;Character set encoding basics Understanding character set encodings and legacy encodings&#8221; (<a href="http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter03">http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&amp;item_id=IWS-Chapter03</a>)<br />
我写过UTF-8、UCS-2、GBK相互转换的软件包，包括使用Windows API和不使用Windows API的版本。以后有时间的话，我会整理一下放到我的个人主页上(<a href="http://fmddlmyy.home4u.china.com/">http://fmddlmyy.home4u.china.com</a>)。</p>
<p>我是想清楚所有问题后才开始写这篇文章的，原以为一会儿就能写好。没想到考虑措辞和查证细节花费了很长时间，竟然从下午1:30写到9:00。希望有读者能从中受益。</p>
<p>附录1 再说说区位码、GB2312、内码和代码页<br />
有的朋友对文章中这句话还有疑问：<br />
&#8220;GB2312的原文还是区位码，从区位码到内码，需要在高字节和低字节上分别加上A0。&#8221;</p>
<p>我再详细解释一下：</p>
<p>&#8220;GB2312 的原文&#8221;是指国家1980年的一个标准《中华人民共和国国家标准 信息交换用汉字编码字符集 基本集 GB 2312-80》。这个标准用两个数来编码汉字和中文符号。第一个数称为&#8221;区&#8221;，第二个数称为&#8221;位&#8221;。所以也称为区位码。1-9区是中文符号，16-55 区是一级汉字，56-87区是二级汉字。现在Windows也还有区位输入法，例如输入1601得到&#8221;啊&#8221;。（这个区位输入法可以自动识别16进制的 GB2312和10进制的区位码，也就是说输入B0A1同样会得到&#8221;啊&#8221;。）</p>
<p>内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的。现在的Windows在系统内部支持Unicode，然后用代码页适应各种语言，&#8221;内码&#8221;的概念就比较模糊了。微软一般将缺省代码页指定的编码说成是内码。</p>
<p>内码这个词汇，并没有什么官方的定义，代码页也只是微软这个公司的叫法。作为程序员，我们只要知道它们是什么东西，没有必要过多地考证这些名词。</p>
<p>所谓代码页(code page)就是针对一种语言文字的字符编码。例如GBK的code page是CP936，BIG5的code page是CP950，GB2312的code page是CP20936。</p>
<p>Windows中有缺省代码页的概念，即缺省用什么编码来解释字符。例如Windows的记事本打开了一个文本文件，里面的内容是字节流：BA、BA、D7、D6。Windows应该去怎么解释它呢？</p>
<p>是 按照Unicode编码解释、还是按照GBK解释、还是按照BIG5解释，还是按照ISO8859-1去解释？如果按GBK去解释，就会得到&#8221;汉字&#8221;两个 字。按照其它编码解释，可能找不到对应的字符，也可能找到错误的字符。所谓&#8221;错误&#8221;是指与文本作者的本意不符，这时就产生了乱码。</p>
<p>答案是Windows按照当前的缺省代码页去解释文本文件里的字节流。缺省代码页可以通过控制面板的区域选项设置。记事本的另存为中有一项ANSI，其实就是按照缺省代码页的编码方法保存。</p>
<p>Windows的内码是Unicode，它在技术上可以同时支持多个代码页。只要文件能说明自己使用什么编码，用户又安装了对应的代码页，Windows就能正确显示，例如在HTML文件中就可以指定charset。</p>
<p>有 的HTML文件作者，特别是英文作者，认为世界上所有人都使用英文，在文件中不指定charset。如果他使用了0&#215;80-0xff之间的字符，中文 Windows又按照缺省的GBK去解释，就会出现乱码。这时只要在这个html文件中加上指定charset的语句，例如：<br />
&lt;meta http-equiv=&#8221;Content-Type&#8221; content=&#8221;text/html; charset=ISO8859-1&#8243;&gt;<br />
如果原作者使用的代码页和ISO8859-1兼容，就不会出现乱码了。</p>
<p>再 说区位码，啊的区位码是1601，写成16进制是0&#215;10,0&#215;01。这和计算机广泛使用的ASCII编码冲突。为了兼容00-7f的ASCII编码，我 们在区位码的高、低字节上分别加上A0。这样&#8221;啊&#8221;的编码就成为B0A1。我们将加过两个A0的编码也称为GB2312编码，虽然GB2312的原文根本 没提到这一点。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
一、几个基本概念<br />
1、bit 与  byte<br />
bite 是二进制的即0和1，译作比特。<br />
Byte是指八个bit，代表一个Ansi或Ascii 代码，即一个英文字母，译作字节。由于汉字使用了16位（比特）代码，所以称为双字节。<br />
其换算关系很简单，一byte等于八bit。<br />
2，ANSI码，ANSI是（American National Standard Institude）的简写。ANCII是American Standard Code for Information Interchange的简写。<br />
ANSI是以标准的八位来显示一个字符的，可以代表256字。基本上包括了拉丁语系中所需要的全部字符。起初美国人认为7位（比特）就足够了，因为2的 7次方等于128，而英文字母只有26个，大小写加一起52个，再加上十个数字，几个标点和数学运算符号，也够了。所以就制定了ANCII七位的代码系 统，这七位的代码系统的128位与ANSI的256中的前128完全一致，加之现在的计算机系统都能自动分别，所以，这两个概念也就不太分别了。<br />
二、GB 2312 汉字编码字符集<br />
GB2312 码是中华人民共和国国家标准汉字信息交换用编码，全称《信息交换用汉字编码字符集•基本集》，标准号为GB 2312―80（GB是&#8221;国标&#8221;二字的汉语拼音缩写），由国家标准总局发布，1981年5月1 日实施。习惯上称国标码、GB码，或区位码。它是一个简化字汉字的编码，通行于中国大陆地区。新加坡等地也使用这一编码。<br />
GB 2312―80收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母，共7445个图形字符。其中 汉字以外的图形字符682个，汉字6763个。由于6763比那GB 2312-80要好记得多，尤其是在GBK也流行的时代，人们总是习惯用6763来代指那通行（同时也让我们痛苦了）若干年的字符系统。<br />
GB 2312-80规定，&#8221;对任意一个图形字符都采用两个字节（Byte）表示。每个字节均采用GB 1988-80及GB 2311-80中的七位编码表示。两个字节中前面的字节为第一字节，后面的字节为第二字节。&#8221;习惯上称第一字节为&#8221;高字节&#8221;（Upper），第二字节为 &#8220;低字节&#8221;（low）。<br />
GB 2312-80将代码分为94个区（Section），对应第一字节，每个区94个位（Position），对应第二字节。两个字节的值，分别为区号值和位号值各加32（20H）。我们通常所说的区位便由此而来。<br />
GB 2312-80规定，01~09区（原规定为1~9区，为表示区位码方便起见，现改称01~09区）为符号、数字区，16~87区为汉字区。而10~15 区、88~94区是有待于&#8221;进一步标准化&#8221;的&#8221;空白位置&#8221;区域。便第10区推荐与第3区的94个图形字符（即GB1988-80中的94个图形字符）相 同，字形宽度为其宽度的一半。）<br />
GB 2312-80把收录的汉字分成两级。第一级汉字是常用汉字，计3755个，置于16~55区，按汉语拼音字母/笔形顺序排列；第二级汉字是次常用汉字， 计3008个，置于56~87区，按部首/笔区顺序排列。字音以普通话审音委员会发表的《普通话导读词三次审音总表初稿》（1963年出版）为准，字形以 中华人民共和国文化部、中国文字改革委员会公布的《印刷通用汉字字形表》（1964年出版）为准。<br />
例：汉字&#8221;啊&#8221;，第一字节为0110000，第二字节为0100001，即16区、01位，用16。<br />
这 些字的来源我不知道是根据什么，但就我处理文献的情况看，有些是对很常用的字，如用于人名的&#8221;�&#8221;字，一是明代著名戏曲理论家&#8221;沈�&#8221;，一是南唐中主（同 时又是文学家）&#8221;李�&#8221;，出现频率比较高，但却没有收在6763之中，而象&#8221;芏&#8221;"塄&#8221;"蓥&#8221;等近千字几乎用不上的字却占据着极紧张的资源。<br />
以后的GBK更有这种情况。<br />
三、GB/T12345 汉字编码字符集<br />
GB/T12345和GB2312一样，是中华人民共和国国家标准汉字信息交换用编码，全称《信息交换用汉字编码字符集辅助集》，标准号为GB/T12345-90，中华人民共和国国家技术监督局1990年6月13日发布，1990年12月1日实施。<br />
GB/T12345-90是一个关于繁体汉字的编码标准。所谓&#8221;辅助集&#8221;，•是与&#8221;基本集&#8221;（GB2312-80）相对应而言。即：GB/T12345 是&#8221;与GB2312相对应的图形字符集。原则上，本字符集是将GB2312中的简化字用相应的繁体字替换而成。因此，这些替代的繁体字具有与被替代的简化 字相同的编码；未曾简化的汉字以及非汉字图形字符，仍是GB2312中的汉字及图形字符，并具有与之相同编码。&#8221;<br />
关于繁体字替换简化字的原 则，GB/T12345注明：&#8221;本标准原则是按照《简化字总表》中所列繁体字与简化字的对应关系进行替换。&#8221;《简化字总表》由中国文字改革委员会1964 年5月发表，后经国家语言文字工作委员会作个别修订，国务院1986年6月4日批准重新发表。<br />
除了以上的根本差异外，GB/T12345与GB2312的区别还有以下几点：1，增补了个别图形字符，共收录7583个图形字符：汉字以外的图形字符716个，汉字6866个（其中一级汉字3755个，二级汉字3008个，增补汉字103个。）<br />
a，&#8221;根据排版需要，增补了竖排标点符号29个，这些字符增补于6区57位至85位。&#8221;<br />
b，&#8221;根据GB5007.1（《信息交换用汉字24×24点阵字模集》），增加了6个汉语拼音用图形字符，这些字符增补于8区27位至32位。&#8221;<br />
c，&#8221;GB2312中，由于60年代汉字简化被精简的字有103个，这些被精简的字根据繁体字处理系统的需要增补于88~89区。&#8221;所谓精简，即废除某 个繁体字，而用另一个字代替，如废除&#8221;�&#8221;字，而以&#8221;云&#8221;字代替。由此形成一个简化字对应两个或两个以上繁体字的现象。<br />
2，GB/T12345规定的在七位环境中指明图形字符集的转义序列不同，同时规定了在八位环境中的转义序列。<br />
GB/T12345没有指明其字符集字形依据，便它使用的繁体汉字，与《简化字总表》中所使用的字形一致。其绝大多数汉字，使用了&#8221;新字形&#8221;。例如， &#8220;产&#8221;的繁体字，它使用了新字形&#8221;�&#8221;，而不自旧字形&#8221;�&#8221;。因此，一些旧字形与新字形的差异，被视为字形的差异（异体字），而不是繁体与简体的差异。 如：收录&#8221;奂&#8221;"换&#8221;"唤&#8221;，而不用&#8221;�&#8221;"�&#8221;"�&#8221;，即因为&#8221;�&#8221;是旧字形，而非繁体字。但是其中极个别字又使用了旧字形，如&#8221;为&#8221;"伪&#8221;的繁体字， 使用了旧字形&#8221;�&#8221;"�&#8221;，而上用新字形&#8221;�&#8221;"�&#8221;。关于新旧字形，可参见中国社会科学院语言研究所编纂的《现代汉语词典》（商务印书馆1978年第一 版）、《新华字典》（商务印书馆1979年修订版）所附的《新旧字形对照表》，以及辞海编辑委员会编纂的《辞海》（上海辞书出版社1979年出版）所附的 《新旧字形对照举例》。<br />
关于被精简的汉字：<br />
1，88~89区所列的103个汉字，GB/T12345称为&#8221;60年代汉字简化时被精简 的字。&#8221;，这一表达不完全准确。例如：，&#8221;丰&#8221;与&#8221;�&#8221;，汉字简化时精简了&#8221;�&#8221;字，以&#8221;丰&#8221;字替代，而GB/T12345将被精简的&#8221;�&#8221;字，作为 &#8220;丰&#8221;的繁体，置于23~65，而将&#8221;丰&#8221;字置于88~19。类似的情况占其103字的三分之一左右。<br />
2，所谓103个&#8221;被精简的汉字&#8221;，只 是被精简的&#8221;繁体字&#8221;，而未包括被精简（废除）的&#8221;异体字&#8221;。例如，&#8221;�&#8221;和&#8221;�&#8221;，作为&#8221;升&#8221;的异体字，被停止使用，GB/T12345亦未收录。相关 的法定文件为中华人民共和国文化部、中国文字改革委员会1955年6月发布的《第一批异体字整理表》，该表列出异体字810组，1865字，并规定废除异 体字1055个。一些异体字，习惯上也被看作是简化字，所以，《简化字总表》特地从《第一批异体字整理表》中选出39个异体字，列为附录。<br />
3，按照汉字简化原则，在容易引起歧义时不简化。例如&#8221;余&#8221;和&#8221;�&#8221;，《简化字总表》对&#8221;�&#8221;字的脚注说；&#8221;在余和�意义可能混淆时，仍用�，如文言句 &#8220;�年无多&#8221;。同时，有些汉字只简化其字义的某一个或几个义项，如徵，在象徵等义项上被简化为征，而在音乐调值的义项上（即宫商角徵羽的徵，读作zhi [止]），并不简化。因此在GB2312中，保留了个别繁体（或异体）字，也就是说，同时收录了一个字的简体和繁体（或异体），这包括&#8221;干乾、后後、伙 夥、么麽、于於、余�、折摺、征徵&#8221;等。作为与GB2312对应的繁体编码，GB/T12345在这些字上处理较混乱。例如：GB/T12345将&#8221;伙&#8221; 置于27-79，&#8221;夥&#8221;置于66-23，与GB2312��相同，即，以&#8221;伙&#8221;��&#8221;伙&#8221;，以&#8221;夥&#8221;��&#8221;夥&#8221;。另一�情�是，GB/T12345� &#8220;後&#8221;置于26-83，对应GB2312的&#8221;后&#8221;，将&#8221;後&#8221;置于65-65，对应GB2312的&#8221;後&#8221;；将&#8221;徵&#8221;置于53-87，对应GB2312的 &#8220;征&#8221;，将&#8221;征&#8221;置于65-71，对应GB2312的&#8221;徵&#8221;，显然不当。<br />
注：<br />
1，以上代码表，除06、08区增补符号用GIF图形编制外，其他均使用GBK代码编制，只有在你的电脑能完全正确GBK汉字时，才能保证看到的上表与GB/T12345标准印刷件（中国标准出版社1991年10月版）相同的字形。<br />
2，尽管满足查看GBK汉字的条件，仍有两个汉字的显示，与GB/T12345标准印刷件有所差异。两个字的代码为47-22、80-89。第一字的印 刷件字形，未列入有关简化字的法定文件，但习惯上被视为&#8221;隙&#8221;的繁体，而GBK编码未收录此字，无法显示，故以&#8221;隙&#8221;替代。第二字的印刷件字形，系对应简 体&#8221;�&#8221;，按照《简化字总表》第二表《可作简化偏旁的简化字和简化偏旁》，&#8221;�&#8221;简化为&#8221;夹&#8221;，所以，&#8221;瘗&#8221;对应的繁体字，应该是&#8221;瘗&#8221;，同时，印刷件上 的此字不见于字书，因此它可能是排版时错误，故上表使用了&#8221;瘗&#8221;字。<br />
3，01~15区的符号和空白位置，除增补者以外，与GB2312的符号、编码位置完全相同。<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;<br />
四、BIG-5字符集<br />
BIG-5码是通行于台湾、香港地区的一个繁体字编码方案，俗称&#8221;大五码&#8221;。它并不是一个法定的编码方案，存在着一些瑕疵，业界的评价也不高，但它广泛地被应用于电脑业，尤其是在国际互联网中，从而成为一种事实上的行业标准。<br />
关于BIG-5码的背景，一直未见详细记载，简单介绍如下：<br />
1983年10月，台湾国家科学委员会、教育部汉字推行委员会、中央标准局、行政院主计处电子资料处理中心共同制定了《通用汉字标准交换码》 （chinese  Ideographic  standard  code for  information  interchange ，简称CISCII码），经试用修订，1986年8月4日由台湾中央标准局公布为法定标准，标准编号为CNS 11643。这一标准于1992年5月21日重新修订公布，更名为《中文标准交换码》（chinese standard  interchange  code）.1995mm 1 月4日，台湾中央标准局又公布了CNS 11643-1《中文标准交换码使用方法》。<br />
BIG-５码是1984年台湾信息工业促进会根据《通用汉字标准交换码》制订的编码方案。至于为何称为&#8221;BIG-5&#8243;。<br />
BIG-5码是一个双字节编码方案，其第一字节的值在16进制的AO~FE之间，第二字节在40~7E和A1~FE之间。因此，其第一字节的最高位是1，第二字节的最高位则可能是1，也可能是0。<br />
BIG-5码的图形符号及汉字，基本与CNS 11643标准的第一、第二字面（Plane）一致，它收录13461个符号和汉字，包括：<br />
1，符号408个，编码位置为A140~A3FE（实际止于A3BF，末尾有空白位置。）<br />
2，汉字13053个，分为常用字和次常用字两部分，各部分中的汉字按笔划/部首排列。其中：<br />
a，常用字5401个，编码位置为A440~C67E。包括台湾教育部颁布的《常用汉字标准字体表》中的全部汉字4808个，台湾国中国小教科书常用字587个，异体字6个。<br />
B，次常用字7652个，编码位置为C940~F9FE（实际止于F9D5，末尾有空白位置）。包括台湾教育部《次常用汉字标准字体表》的全部汉字6341个，《罕用汉字标准字体表》中使用频率较高的字1311个。<br />
其余的A040~A0FE、C6A1`FEFE为空白区域。一些空白位置，经常被用于用户造字区，而且多存放香港常用字和粤语方言字。<br />
现在流行的BIG-5码字库，在F9D6~F9DC位置大都有7个常用字，据说为倚天系统所增。若计此7字，则全数为13060个汉字，13468个汉 字和符号。此外，一些BIG-5码字库，如Windows繁体中文版的True Type细明体（华康科技提供，2.0版），在F9DD~F9FE位置还有33个制表符和1个&#8221;■&#8221;符号。<br />
五，BIG5+码<br />
1，编订BIG5+码之缘起<br />
台湾行政院协助解决众多使用BIG5码政府单位于进行公文电子传递时寓到自造字无法转换CNS问题，而于数次会商后决议成立专案委托中文电脑基金会办理[BIG5码字集扩编计划]，86年7月扩编完成。<br />
2，编码原则<br />
BIG5 +码系以CNS为蓝本，共增编标准字集4760个字符与推荐字集3250个字符；其标准字集即纳编CNS第3字面字集内之4145个，第4个字面字集内之 219个字，均为一般文书常用之中文字，如推广应用于研究发新版中文软体，则估计可解决80％的BIG5自造字转换CNS交换码问题。<br />
（一），长度仍为双字节，即高字节之第一位元（MSB）=1。<br />
（二），保留原有之标准字集字区及使用者加字区，使与原有系统具相容性。<br />
（三），以国家标准（CNS11643）及国际标准（ISO10646）字集为字源范围，并依CNS之序编入。<br />
（四）包含于ISO10646或CNS11643字集内且市面已广为使用之倚天自造字及符号，编入标准字集并保留原码位。<br />
（五），单独成字之部首不再重覆编码（如金、木、水、火、土）。<br />
（六），有重复的字删除其后者，错字则依CNS修正之。<br />
3，字码架构<br />
（一），总码位：由原有之19782个扩大为23940个（高字节为81-FE，低位元组为40-7E、80-FE）。<br />
（二）编码区间<br />
a，第一标准字集：此区即原BIG-5码标准字集但删除22个重字，编码范围为A140-F9FE（高字节为A1-F9，低字节为40-7E、A1- FE）。共有13973个字符，包括常用汉字5401个（A440-C67E），次常用汉字7693个（C940-F9D5）及符号471个（A140- A3FE）、字符408个（C6A1-C8FE）。<br />
b，第二标准字集：此区即扩编部分，编码范围为8180-FEA0（高字节为81-F9，低字节为80-A0）。共收编罕用汉字4158个。<br />
c，CMEX推荐字集：因BIG-5码系统之编码位置有限，未能编入第一及第二标准字集之较常用罕用及异体汉字、简体字与日韩汉字3454个，经中推会 （CMEX）建议集中收编于此区。编码范围为原造字区之8140-83FE、8E40-A0FE（高字节为81-83、8E-A0，低字节为40―7E、 A1-FE）。<br />
d，造字区：仅使用第二标准字集时，仍保留5809个码位供使用者造字，可编码区间不变；但同时使用推荐字集时，因BIG5+ 码之推荐字集系使用原造字区之8140-83FE及8E40-A0FE，供造字之码位仅余2355个，可编码区间为FA40-FEFE（785个码位）、 8440-8DFE（1570个码位）。<br />
e，使用者专用字集：为使各行业专用之字集亦能进行信息交换，向中推会申请登记ID后，将ID字形等依照 输规定传出供对方显示或列印。<br />
使用者专用字集之编码区与CMEX推荐字集相同，亦使用到原造字区。<br />
4，可用之工具<br />
（一），24＊24点阵字形档。<br />
（二），注音符号、仓颉码属性档。<br />
（三），CNS11643、ISO10646码对照档。<br />
（四），BIG5+〈――〉ISO10646转码程序。<br />
（五），BIG5+〈――〉CNS11643转码程序。<br />
（六）BIG-5码自造字转BIG-5码管理程序。<br />
（七）BIG-5自造字转码程序。<br />
5，使用方法<br />
因BIG5+码在标准字集外尚提供推荐字集，各单位可依自己原有造字情况选择适当之使用方法：<br />
（一）字集之使用1.以下情可使用全字集（即第一、第二标准字集及推荐字集，共21585个字符）<br />
（1），全无自造字者。<br />
（2），原来已有自造字，其编码区间未与推荐字集重叠者，（即FA40―FEFE及8440-8DFE以外）<br />
（3），原来已有自造初开球编码区间虽与推荐字集重叠，但可全部转换为新码者。<br />
（4），原来已有自造字，但经转换为新码后剩余自造字未超过2355个，且可以或原意改置于FA40-FEFE及8440-8DFE以外者。2.以下情况仅使用标准字集（即第一与二标准字集，共13461个字符）：<br />
（1），有自造字，但转码后剩余自造字仍超过2355个者。<br />
（2），原有自造字耸部或部分落于FA40-8440-8DFE两个造字区（推荐字集使用范围）内，不易或不愿转换为新码者。<br />
（二）字形转输与交换规格之使用<br />
BIG -5码虽已扩编，但其余未能纳入自造字及未来不断新增之自造字，依旧会产生交换及传送问题；为使这些自造字于网路传输及档案交换时，仍可作字形显示与列 印，特订定以下几项规格：1，文件档案交换传输规格，依SGML（ISO8879）格式及CNS（ISO9541）字形资讯交换规格，订定SGML文件档 案内字形应含之参数。2，中文周边装置字形下载规格：包括中文终端机、打印机及其他终端设备，系依CNS13479（ISO6429）规范订定字形下载之 规格。<br />
（三）用户需准备之工作<br />
BIG-5码编扩编后纳入之自造字，如不作转码，将来交换时一定会发生一字两码的问题，因此在BIG5+码 之新版中文系统软体推出前，用户必需先转换现在自造字之旧码，其程序如下：1，建立自造字之旧码与扩编后新码对照表：各单位之造字区管理者可利用第六项工 具[BIG5自造字转标准字对照表管理程式]比对造字区内自造字后建立单位内新/旧码对照表。2，清查需要转码之资料档：各单位或集中或各自处理，均必需 先清查所有用过原造字区字码之料档，以备进行转码。3，自造字旧码之转换：各项业务负责人或各使用者可利用第七项工具[BIG5自造字转标准字转换程式] 及所建立之单位内新/旧码对照表，将所有的[文字档（.txt。）原用之自编旧码转换为BIG5+新码。4，单位内造字区之重整；为避免转码后发生一字两 码之现象，各单位原有之造字区应作整理，删除已编入BIG5+码系统者，其余自造字则保留原编码或重新编码（重整造字区）。<br />
6，应用现况<br />
台湾厂商如：芙蓉坊、昌泰科枝、大同、倚天等公司已将BIG5+码应用于新产品中。</p>
<p>六、台湾制定的CNS11643<br />
1，编订中文标准交换码之缘起<br />
72年10月由台湾科学委员会、教育部、中央标准局及本中心合编[通用汉字标准交换码]后决议试用二年；试用期满，经检讨修正重编并向中央标准局申请订 为国家标准，75年8月4日获该局审定公布国家标准，编号[CNS11643]；81年51 21日再由该局因应实际需要修订扩编，并更名为[中文标准交换码（chinese standard interchange code）]。<br />
2，CNS11643之适用范围<br />
本标准适用于中文信息之处理。<br />
3，编码之各项考虑<br />
中文信息标准交换码是否能普遍地推广使用，使一般使用者共同乐意接受，端视其是否具有实用性，因此本码之编码原则研订时，曾先就标准码的结构、编码需求等作多方面的周密考虑。<br />
（一），以教育部所公布的四个字体表之字集为范围。<br />
（二），根据使用的频率及范围，整理后分别编排于各个字面，以适应各个层次之使用者。<br />
（三），符合国际信息传输上所使用之CNS5205[信息处理及交换用七位码字符集]及CNS7654[信息处理-七位及八位码字符集-延码技术]标准通信定则。<br />
（四）涵盖常用之外语字母及工商界与学校所使用之文字及符号。<br />
4，字集编排原则<br />
（一），中文标准交换码分为十六个字面，每个字面可陈列94列＊94行，即8836个字符。目前第一至第七字面列有字集，第八至第十一字面预留扩编之用；第十二至第十六字面则为使用者加字区，凡未收于本码系统之中文及符号，他用者可视需要自行编订于加字区使用。<br />
总支持文字量达141376个。<br />
（二）各字面字集排列大抵依使用频率为次序，每一字面以常用字为主，第二字面以次常用字为主，第三字面以部分罕用字及较常用异体字为主，第四字面以 ISODIS10646第二版之汉字、各单位/信息业用字及户政用字为主，第五字面以罕用字为主，第六、第七字面以异体字为主。其中第一第二字面字集先于 民国七十五年八月四日公布为国家标准。<br />
5，字码编排原则<br />
（一），文字之选择及字体悉依教育部[汉字标准字体表]为基准。说明：中 国文字的困扰主要有两方面，一是文字的数量太大，二是异体字繁多。实际上一般人常用的不过七千字左右，新字又不断的增加，造成中文资料处理上的困难；而教 育部的标准字体表之字集系经多年之搜集、考证、分析、选取，为较不偏颇，最具客观性之用字字集，应能符合一般使用者之需求。<br />
（二），以2个字节（bytes）为中文码编码单位，并以十六进位制之文数字表示之。说明：[以2个字节为字码单位，于处理时可增加信息传输之速度]，符合一般资料处理作业之需要。采用十六进位制数字编码，系因应资料处理人员惯用之进位法，用以表示两字节最为简明。<br />
（三）符合CNS5205及CNS7654之通信定则。说明：本编码为符合CNS5305及CNS7654通信定则之规定，所有控制码均予避开，即字码 中之00至20以及7F均予避开，则7BIT字码集共有94个编码位置，两个字节革命可编8836个中文字码，订为一字面。<br />
（四），依字之使用频率而编排于各不同字面。说明：在做信息传输时，若欲传送出现在不同字面上的字，必须先送出转字面控制码。为提高传输效率，常会一起出现的字编在同一字面中，可减低字面转换的次数。<br />
（五），使先笔画后部首的排列顺序来编订字码。说明：每一字面均按文字灭口笔画数为首序编订字码，使用者以笔画数即可查寻字码。<br />
六、字集之说明<br />
第一字面：本编码系统为减少字面转换次数，特编最常用之中文字及符号、字母、部首等于第一字面；所编字汇及码区分别说明如下：<br />
1，符号区<br />
符号区之编码位置规划于第一字面之2121至427E，有3102个编码位置，目前暂编符号684个，所余空位供尔后增添之用。<br />
已编入之特殊符号及文字类别如下：<br />
（1），间隔符号1个。<br />
（2），标点符号28个。<br />
（3）括号及制表符号89个。<br />
（4），一般符号34个。<br />
（5）、学术符号51个。<br />
（6）、单位符号31个。<br />
（7）数字符号42个，包括阿拉伯数字10个，罗马数字大小写共20个，中国数字12个。<br />
（8）外文字母100个，包括大写英文字母，小字英文字母各26个，大写希腊字母、小写希腊字母各24个。<br />
（9）汉字注音符号42个。</p>
<p>（10）数字序列符号20个。<br />
（11）中国文字部首213个（夕，夕两部首同归于夕部首中，夕部首得于将来扩编时一并列入增订。）<br />
（12）控制码符号33个。<br />
2 中文字区<br />
CNS第一字面之中文字区编码区间由4421至7D4B，所编字汇5401字，除包括教育部颁订之&#8221;常用汉字标准字体表&#8221;所列全部4808字外，并优收 编国中、国小教科书中常用字587字及异体字6字。第二字面：本字集所编字汇7650字，除教育部所颁&#8221;次常用汉字标准字体表&#8221;外，并筛选编入罕用字表中 使用频率较高之1320字。字码区间为2121至7244。第三字面：本字集即77年6月行政院主计处电子处理资料中心为搜集仍涵盖教育部罕用及异体字表 中之较常用字，所编订之使用者加字区第14字面字集第一部分，字数6148字；原码序不变，字码区间仍为2121至6246。第四字面：本字集所编字汇 7298字，除包括原第14字面第二部分171字外，并搜集户役政及其他使用单位，ISO10646第2版汉字集、信息业次常用字而成，字码区间为 2121至6E5C。第五字面：本字集所编字汇共8603个字，系未包含于前4个字面之教育部罕用字。字码区间为2121至7C51。第六字面：本字集所 编字汇共6388个字，为不包含于前5个字面且笔画在14画（含）以下之教育部异体字。字码区间为2121至647A。第七字面：本字集所编字汇6539 个字，为不包含前6个字面之教育部异体字，字码区间为2121为6655。使用者得视自己的需求参考本标准之字集、字序编订内码表。<br />
七，CNS11643之使用<br />
（一）字面之指定与转换依据CNS7654（78年7月15日版）第5。3。9节之规定，中文码可置于多字节符号字库（MULTIPLE BYTE GRAPHIC  REPERTOIRE）中，经由ESC2/4 2/9 F四个字节之逸出顺序码指定于G1字集，或经由ESC2/4 2/10 F 指定于G2字集，亦可经由ESC2/4 2/11 F指定于G3字集，其中F 可用3/0~3/15来指定相对之一至十六中文字面；至于英文之字集则可经由ESC2/8 F 指定于G0字面。在7个位元的环境下，对于各种字面的使用说明如下：1，利用SI使用G0字面，并为锁定方式。        2，利用SO使用G1字面，并为锁定方式。3，利用LS2使用G2字面，并为锁定方式。4，利用LS3使用G3字面，并为锁定方式。5，利用SS2使用 G2字面，并为非锁定方式。6，利用        SS3使用G3字面，并为非锁定方式。<br />
为求使用方便，终端设备在开机时可将G0、G1、G2等三个字集分别设定为ASCII、第一字面及第二字面，将G3字集设定为其他较常用的字面。有关这些控制码的使用，请参考CNS7654        。<br />
（二）使用者加字区之使用：<br />
为适应各种不同性质之中文资料处理作业，CNS11643特别订定自第十二字面起为使用者加字区；尚未收编于本系统之中文字或符号。由使用者视需要先编于此区内使用；字面之指定与转换方法与前七个字面相同。<br />
八，CNS11643之推广应用<br />
本交换码系统依国家标准法之规定，系由经济部中央标准局负责检讨增修之，但该局为加强推广该标准之应用，特将此系统及中文字型档委托本中心代为办理推广 应用事宜；本中心为顾及标准字型档之完整性，以利此标准之推广，另再商得内政部及经济部工业局同意一并提供其他字型档。<br />
CNS11643目前之应用情形如下：<br />
（一）台湾之应用情形<br />
1，公文电子交换之标准传递码，行政院&#8221;政府机关公文电子传递作业&#8221;决定，凡是经&#8221;交换中心&#8221;（交通部管资中心）之公文，一律须先转换为CNS后再传递。<br />
2，EUC码援用CNS之字集及架构：UNIX系统上使用之EUC虽为4BYTE之内码，但却全部采用CNS之编码架构及字集；其2个低字节之HIGH均OFF后字码即与CNS完全相同，因此不需再以对照表方式转换；亦可视为CNS应用于内码之实例。<br />
3，BIG5+码之字源：86年7月完成之&#8221;BIG5+&#8221;（即BIG-5码之扩编）系以CNS11643为蓝本，纳编CNS第3字面之4，145个、第4字面之219个一般文书常用之中文字。<br />
（二）国外之应用情形<br />
ISO10646及UNICODE汉字均收编CNS字集：ISO10646及UNICODE目前共收编20902个汉字，其中17011个字系来自 CNS（第1第2字面及第3字面3895个，第4字面56个），现又增编CNS的5881个字。因此，不便台湾标准得与国际标准相容，国内电脑业者在国际 市场之竞争力得以增强，将来ISO10646及UNICODE发展成熟后，使用者亦可得以顺利转换。<br />
七，CCCII编码<br />
CCCII编码是CHINESE CHARACTER CODE FOR INformATION INTERCHANGE 的缩写，是经台湾中研院中美会及国科会等单位支持，于1979年12月25日集合由台湾图书馆学者，文字学家及电脑专家组成&#8221;汉字整理小组&#8221;提出的汉字编 码，已广泛用于港台图书馆及与美国网上数字化图书信息中心OCLC系统。该编写系统提供了94面（PLANE）×行（ROW）×94列（CELL）= 830584字符空间；其中每六个面构成一个层（LAYER）提供6×94×94=53016编码空间，（最后一层只有四个面）。各层定义的汉字情况如 下：<br />
第1层，符号和繁体汉字。<br />
第2层，大陆的简体汉字。<br />
第3-12层，汉字异体字。<br />
第13层，日本汉字。<br />
第14层，朝鲜汉字。<br />
第15层，保留字。<br />
第16层，杂项字（日本与朝鲜）<br />
第一至十二层的编码的编码存在关联含义，就是说同样的码在这些不同的层表示同一个汉字的不同变形。如第一层表示繁体字，第二层表示大陆简体字（如果有的话），第三至十二层表示其他的异体字，例如以下这个字的三种变形，编码的第二三字节是相同的：<br />
字形类型编码点，层字样<br />
繁体字  OX224E411<br />
简体字  OX284E412<br />
异体字  OX2E4E413<br />
第一层所定义的字符集如下：第1面/第2行56数学符号第1面/第3行ASCII第1面/第11行35中文标点符号第1面/第12-14行214康熙字 典偏旁部首第1面/第15行41中文数字，37拼音符号，4音调符号第1面/第16-67行4808备用字，字码213021-21637E第1面/第 68行-第3面/第64行17032备用字，字码216421-23607E20583罕用字，字码为236121-262543第3面/第65行含教育 部颁定之罕用字汇12924字，次常用字汇314字，第6面/第5行以及康�字典、中文大辞典、财税资料考核中心字汇、电信传输码字汇、五大专题码字汇， 与其他信息字汇7345字。<br />
第二层收异体字共11517字，其中包含大陆简体字3625字，其它简体字7892字所有各层的第一行均为保留行，共收字53940个。<br />
四交大资料-BBS95年1月中国文字资料库（CCDB）字型集的应用（1）中国文字资料库（CCDB）字型集的应用（2）中国文字资料库（CCDB） 字型集的应用（3）中国文字资料库（CCDB）属性档介绍。三，ANSIZ39.64-1989 THIS NATIONAL STANDARD IS DESIGNATED as ANSIZ39.64-1989 and named &#8220;EAST ASIAN CHARACTER CODE&#8221;（EACC），but was origianlly known as REACC (RLIN EAST ASIAN CHARACTER CODE), THAT IS BEFORE IT BECAME A NATIONAL STANDARD RLIN STANDS FOR &#8220;RESEARCH LIBRARIES INformATION NETWORK &#8221; which was developed by the<br />
B ，浏览器：IE4。01（或更高的版本）中文版，或NETSGAPE NAVIGATOR 3。X<br />
2，其他语种的WINDOWSS 95（或更高的版本）+微软简体中文支持或外挂中文平台。一般情况下，使用外挂中文平台时，需要将当前环境设置成为GBK码，并关闭汉字自动识别的功能。而且，许多外挂中文平台不支持全部GBK汉字。<br />
3，已知的常见错误。<br />
A，IE4。0无法显示GBK/4 AB-AF、F9-FD以及FE 中 FE40-FE4F各位置的汉字。<br />
B，在简体WINDOWS95环境下，NETSGAPE NAVIGATOR4。X 无法显示GBK/3中XXA0位置的汉字，A040-AOFE位置显示错误。<br />
C，在繁体WINDOWS95环境下，NETSGAPE NAVIGATOR4。X不能正确显示GBK/3-GBK/5之间的字符。<br />
GBK代表码（按分类顺序排列）<br />
GBK/1：GB2312非汉字符号A1-A9<br />
B0-B7B8-BF C0-C7C8-CF D0-D7<br />
GBK/2：GB2312汉字<br />
D8-DFE0-E7E8-EFF0-F7<br />
81-8384-87 88-8B8C-8F 90-93<br />
GBK/3：扩充汉字<br />
94-9798-9B 9C-A0<br />
AA-AFB0-B7B8-BFC0-C7C8-CF<br />
GBK/4：扩充汉字<br />
D0-D7D8-DFE0-E7E8-EFF0-F7<br />
F8-FE<br />
GBK/5：扩充非汉字<br />
A8-A9<br />
（1）AA-AF  （2）F8-FE<br />
用户自定义区<br />
（3）A1-A7</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2011/09/3962.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>浪潮之巅</title>
		<link>http://blog.so8848.com/2011/08/46714.html</link>
		<comments>http://blog.so8848.com/2011/08/46714.html#comments</comments>
		<pubDate>Sat, 06 Aug 2011 14:29:04 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[浪潮之巅]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2009/01/46714.html</guid>
		<description><![CDATA[浪潮之巅 Google黑板报上连载的长文 第一章 帝国的余辉（AT&#38;T）&#160;&#160; 1 百年帝国&#160;&#160; 2 几度繁荣&#160;&#160; 3 利令智昏&#160;&#160; 4 外来冲击 第二章 蓝色巨人（IBM）&#160;&#160; 1 赶上机械革命的最后一次浪潮&#160;&#160; 2 领导电子技术革命的浪潮&#160;&#160; 3 错过全球信息化的大潮&#160;&#160; 4 他也是做（芯）片的&#160;&#160; 5 保守的创新者&#160;&#160; 6 内部的优胜劣汰 第三章 “水果”公司的复兴（乔布斯和苹果公司）&#160;&#160; 1 传奇小子&#160;&#160; 2 迷失方向&#160;&#160; 3 再创辉煌&#160;&#160; 4 大难不死 第四章 计算机工业的生态链&#160;&#160; 1 摩尔定理（Moore’s Law）&#160;&#160; 2 安迪-比尔定理（Andy and Bill’s Law）&#160;&#160; 3 反摩尔定理 （Reverse Moore’s Law） 第五章 奔腾的芯（英特尔——Intel）&#160;&#160; 1 时势造英雄&#160;&#160; <a href='http://blog.so8848.com/2011/08/46714.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<h6><a href="http://fangyixun.spaces.live.com/blog/cns!9A3A9085BEA82402!784.entry">浪潮之巅</a></h6>
<p>Google黑板报上连载的长文 </p>
<p>第一章 帝国的余辉（AT&amp;T）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2007/07/at.html">百年帝国</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2007/07/at_18.html">几度繁荣</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2007/07/at_20.html">利令智昏</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2007/07/at_24.html">外来冲击</a> </p>
<p>第二章 蓝色巨人（IBM）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2007/08/ibm.html">赶上机械革命的最后一次浪潮</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2007/08/ibm_06.html">领导电子技术革命的浪潮</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2007/08/ibm_07.html">错过全球信息化的大潮</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2007/08/ibm_10.html">他也是做（芯）片的</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2007/08/ibm_14.html">保守的创新者</a><br />&nbsp;&nbsp; 6 <a href="http://googlechinablog.com/2007/08/ibm_17.html">内部的优胜劣汰</a> </p>
<p>第三章 “水果”公司的复兴（乔布斯和苹果公司）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2007/08/blog-post_29.html">传奇小子</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2007/08/blog-post_30.html">迷失方向</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2007/09/blog-post_12.html">再创辉煌</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2007/09/blog-post_30.html">大难不死</a> </p>
<p>第四章 计算机工业的生态链<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2007/10/blog-post_10.html">摩尔定理（Moore’s Law）</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2007/10/blog-post_3090.html">安迪-比尔定理（Andy and Bill’s Law）</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2007/10/blog-post_16.html">反摩尔定理 （Reverse Moore’s Law）</a> </p>
<p>第五章 奔腾的芯（英特尔——Intel）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2007/10/intel.html">时势造英雄</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2007/10/intel_26.html">英特尔摩托罗拉之战</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2007/10/intel_30.html">指令集之争</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2007/11/intel.html">英特尔和 AMD 的关系</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2007/11/intel_15.html">天步艰难</a> </p>
<p>第六章 互联网的金门大桥（思科）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2007/12/blog-post_13.html">好风凭借力</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2007/12/blog-post_14.html">好风凭借力（续）</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/01/blog-post.html">持续发展的绝招</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2008/01/blog-post_04.html">竞争者</a> </p>
<p>第七章 硅谷的见证人（惠普公司）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2008/02/blog-post_22.html">昔日硅谷之星</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2008/02/blog-post_27.html">争议的生死抉择</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/02/blog-post_28.html">最有争议的CEO</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2008/03/blog-post_04.html">亚洲制造的冲击</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2008/03/blog-post_10.html">峰回路转</a> </p>
<p>第八章 没落的贵族（摩托罗拉）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2008/03/blog-post_21.html">二战的品牌</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2008/03/blog-post_24.html">黄金时代</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/04/blog-post_03.html">基因决定定理</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2008/04/blog-post_10.html">铱星计划</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2008/04/blog-post_11.html">全线溃败</a><br />&nbsp;&nbsp; 6 <a href="http://googlechinablog.com/2008/04/blog-post_21.html">回天乏力</a> </p>
<p>第九章 硅谷的另一面<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2008/06/blog-post_17.html">成王败寇</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2008/06/blog-post_23.html">嗜血的地方</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/07/blog-post.html">机会均等</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2008/07/blog-post_04.html">硅含量不断降低</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2008/07/blog-post_08.html">亘古而常青</a> </p>
<p>第十章 短暂的春秋——与机会失之交臂的公司<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2008/07/blog-post_22.html">昔日的辉煌（Sun Microsystems）</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2008/07/blog-post_29.html">错失良机（Sun Microsystems）</a> </p>
<p>&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/08/blog-post.html">历史的回放（Sun Microsystems）</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2008/08/blog-post_04.html">局域网的微软（Novell）</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2008/08/blog-post_27.html">网景公司（Netscape）</a><br />&nbsp;&nbsp; 6 <a href="http://googlechinablog.com/2008/09/blog-post_05.html">Real Networks</a> </p>
<p>第十一章 幕后的英雄——风险投资（Venture Capital）<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2008/09/venture-capital.html">风投的起源</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2008/09/venture-capital_13.html">风投的结构</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/09/venture-capital_17.html">风投的过程</a><br />&nbsp;&nbsp; 4 <a href="http://googlechinablog.com/2008/09/venture-capital_19.html">投资的决策和公司的估价</a><br />&nbsp;&nbsp; 5 <a href="http://googlechinablog.com/2008/10/venture-capital.html">风投的角色</a><br />&nbsp;&nbsp; 6 <a href="http://googlechinablog.com/2008/10/venture-capital_09.html">著名的风投公司</a> </p>
<p>第十二章 信息产业的规律性<br />&nbsp;&nbsp; 1 <a href="http://googlechinablog.com/2008/11/blog-post.html">70-20-10律</a><br />&nbsp;&nbsp; 2 <a href="http://googlechinablog.com/2008/11/blog-post_04.html">诺威格定律</a><br />&nbsp;&nbsp; 3 <a href="http://googlechinablog.com/2008/11/blog-post_05.html">基因决定定理</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2011/08/46714.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>社交的未来</title>
		<link>http://blog.so8848.com/2011/07/30366.html</link>
		<comments>http://blog.so8848.com/2011/07/30366.html#comments</comments>
		<pubDate>Fri, 01 Jul 2011 02:27:35 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[Java]]></category>
		<category><![CDATA[MISC]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/04/30366.html</guid>
		<description><![CDATA[2008年第8期 总第242期 封面报道 即将改变的不仅是商业模式，还包括商业本身。 如果让中国的互联网企业对未来的美国总统投票，他们会选谁？ 这个非常“无厘头”的问题，还真有人作出了答案。4月8日，中国的搜索引擎公司百度，将自己首页的月度人物授予了美国总统候选人——民主党的巴拉克· 奥巴马（Barack Obama）。因为这位美国总统候选人懂得利用互联网来为自己现实中的竞选造势，这正契合百度这样的互联网公司所一直推崇的“互联网影响传统世界”的口 味。200多年来，美国的大选比拼的就是竞选的个人在现实社会中的影响力，这些候选人通过自己的社交来巩固及维系自己在美国社会中的人际关系与地位，以自 己为中心向周围的人传达出自己的各种施政信息。最初，林肯只能坐着马车来巡回演讲；七八十年前，为了获得胜利，罗斯福已可以拿着广播喇叭进行宣传；到了肯 尼迪时代，在电视上面对万千观众发表演说成为了常态。 如今看看奥巴马都在互联网上做了什么吧！美国联邦选举委员会公布的资料显示，奥巴马在今年1月份收到的3600 万美元捐款中，有2800 万美元是通过互联网募集到的，而且，其中90％的捐款，单笔金额都在100 美元以下。和传统的通过竞选集会，以及举行募款餐会的传统社交筹款模式不同，奥巴马得到的这些小额捐款，多半是自发的网上转账。 为奥巴马筹款的马克· 戈伦博格，是美国硅谷的一位风险投资家。这位硅谷的投资者与eBay 创始人之一的史蒂夫· 卫斯礼，还有其他一批网络精英，帮助奥巴马将官方网站（BarackObama.com）打造成了一个支持者的虚拟社区——只要在网站上注册，就能得到名 为“我的奥巴马”的网络即时通告，详细了解奥巴马的动态。粉丝们在网站上输入自己的邮政编码，就能得到所在地区为奥巴马进行助选活动所具有的信息列表，并 据此加入支持奥巴马的团体。戈伦博格说：“这些集会吸引了社区人群的极大兴趣。人们一回家就上网捐款。而这些人以前从没卷入过竞选活动。”相形之下，奥巴 马的党内对手——希拉里，也在自己的官方网站上设置了类似的“邮编定位”功能，以聚拢和发展支持者，但效果远逊于奥巴马。这里的原因是，奥巴马进入了 Web2.0 时代，通过技术手段更方便地让人在虚拟空间中进行交流。 在奥巴马的官方网站中，有一项支持者分布地图，通过分布者地图，支持者们可以很方便地相互联系，也可以在网站里交流信息、建立博客、召开网上集会 等。除此之外，奥巴马在互联网上几乎无所不在，Facebook、Myspace、YouTube、Digg、flickr、Twitter这些眼下最火 的Web2.0 网站上都有奥巴马的身影。 在Myspace上，奥巴马有超过34万的好友，在Facebook上，支持者的数量接近76万，在YouTube上提供的奥巴马的视频频道，总浏览量已经超过了1300万，即使如Twitter这样的非主流的迷你博客，奥巴马也获得了2万多人的关注。 竞选从来都是一次大规模的社交活动，或者说是一次大规模的信息交互运动。候选人通过发送信息来确立自己的支持者，也通过接受信息来调整自己的形象和立场。而所有涉及信息的东西，必然被互联网时代所改变。 或许奥巴马的例子我们可以推演到整个商业社会，社交是人类所有活动的基础，当这种基础开始随着互联网的发展而产生变化的时候，网络社交演化出那些眼 花缭乱的商业模式其实开始变成了小事。人们需要看到的是，社交的未来将会给商业组织的内涵和外延的表现形式带来改变，而一些传统商业规则和思路也必将面临 着调整与重建。 网络社交改变了什么 杜晨,李黎 QQ缩减了交流成本，个人的影响力门槛也逐渐降低 以前，我们要亲自参加社交活动 现在，我们用虚拟身份交流 未来，当现实与虚拟混合，社交是什么样 人类学家很早就了解到，世界上不同文化背景的人———从亚马逊流域的猎人兼采集者，到非洲的牧人———都拥有类似的社会模式。例如，人们都按照若干 层“圈子”来组织自己的人际关系：最近的圈子被称作“死党”，他们称得上是真正的朋友，在最紧要的关头，他们会毫不犹豫地拉你一把。在真正的朋友以外的圈 子是有某种“特殊联系”的意气相投者，这类人你也以朋友相称，他们会帮助你，但是他们会衡量最高成本是多少。而最外面的圈子——“熟人”人数更多当然联系 也更为松散，他们也可以帮你，但是他们要考虑最低收益是多少。 对于所有人来说，“死党”、“朋友”、“熟人”的圈子是有极限的。比如万通董事局主席冯仑在他的《野蛮生长》一书中坦言这辈子的社交圈子总共超不过70人。 人们都知道朋友多了好办事，但是最终却只能有很有限的社交圈子，这是为什么？社交的成本自然是关键。你需要投入时间、金钱甚至感情去社交，所以如果有办法让你至少可以在时间和金钱层次降低社交的成本，那人们自然会乐此不疲。 简单来说，网络社交就是这么发展起来的，而随着社会的发展，原有的社交模式也正在快速的变革，其结果就是我们可以打保票，如果熟人的概念可以延伸到网络上，不再以握过手和知道真名实姓来定义，那么冯仑的孩子的社交圈子肯定比他多。 当然，社交的未来不仅仅意味着个体社交圈子的数量变化，因为个体的变化必然带来社会各级组织形态的变异。 越来越模糊的组织边界 新东方在线的运营总监潘欣自2000年在互联网泡BBS以来，社交圈正在快速膨胀。在中国的几个主流的社交网站中，潘欣都是其中的活跃人物。在校内网他有约150个好友，在海内上他有超过340个好友，这些虚拟空间中的朋友很多都是现实朋友的延伸。 真正吸引潘欣的是交流沟通成本的降低。沙龙、俱乐部、舞会、酒会等形式都是不断演进着的社交方式，但是自始至终没法改变的就是高成本和低效率。但 是，互联网却提供了这样一种低成本、无地域沟通的可能，潘欣和朋友的交流再也不需要现实的空间和整块的时间，他只要去别人的空间和博客留言或是发一封邮件 就行。 虽然潘欣还是坚持着“三圈理论”，核心的还是那些在现实中的朋友。不过，潘欣承认即便是外层关系圈的“低成本延展”也是很有意义的事情。实际上，人 类社会主要就是由无数外层关系圈组成，这个圈子很多时候是以某种组织的形态出现的，比如社团，再比如企业，而新的社交方式正在让这些组织的形态产生变化。 今天，当某些社会新闻中的个体在猫扑的论坛中引起争议时，就会有人倡议“呼唤人肉搜索”将相关人的资料全部查出公开在网络上，参与“人肉搜索”的大 <a href='http://blog.so8848.com/2011/07/30366.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<div id="blog_text" class="cnt">
<div>
<div class="article-title"><strong>2008年第8期  总第242期 封面报道</strong></div>
<div class="article-title"> </div>
<div class="article-title">
<div class="imgborder">
<div>
<div>
<div class="galleryimage" align="center"><img alt="即将改变的不仅是商业模式,还包括商业本身." src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115384338328901.jpg" name="4982" /></div>
<div class="img_description" align="center"><font color="#009999">即将改变的不仅是商业模式，还包括商业本身。</font></div>
<div class="img_description"> </div>
</div>
</div>
</div>
</div>
<div class="article-content">
<p>如果让中国的互联网企业对未来的美国总统投票，他们会选谁？</p>
<p>
这个非常“无厘头”的问题，还真有人作出了答案。4月8日，中国的搜索引擎公司百度，将自己首页的月度人物授予了美国总统候选人——民主党的巴拉克·<br />
奥巴马（Barack<br />
Obama）。因为这位美国总统候选人懂得利用互联网来为自己现实中的竞选造势，这正契合百度这样的互联网公司所一直推崇的“互联网影响传统世界”的口<br />
味。200多年来，美国的大选比拼的就是竞选的个人在现实社会中的影响力，这些候选人通过自己的社交来巩固及维系自己在美国社会中的人际关系与地位，以自<br />
己为中心向周围的人传达出自己的各种施政信息。最初，林肯只能坐着马车来巡回演讲；七八十年前，为了获得胜利，罗斯福已可以拿着广播喇叭进行宣传；到了肯<br />
尼迪时代，在电视上面对万千观众发表演说成为了常态。</p>
</p>
<p>如今看看奥巴马都在互联网上做了什么吧！美国联邦选举委员会公布的资料显示，奥巴马在今年1月份收到的3600 万美元捐款中，有2800<br />
万美元是通过互联网募集到的，而且，其中90％的捐款，单笔金额都在100<br />
美元以下。和传统的通过竞选集会，以及举行募款餐会的传统社交筹款模式不同，奥巴马得到的这些小额捐款，多半是自发的网上转账。</p>
</p>
<p>为奥巴马筹款的马克· 戈伦博格，是美国硅谷的一位风险投资家。这位硅谷的投资者与eBay 创始人之一的史蒂夫·<br />
卫斯礼，还有其他一批网络精英，帮助奥巴马将官方网站（BarackObama.com）打造成了一个支持者的虚拟社区——只要在网站上注册，就能得到名<br />
为“我的奥巴马”的网络即时通告，详细了解奥巴马的动态。粉丝们在网站上输入自己的邮政编码，就能得到所在地区为奥巴马进行助选活动所具有的信息列表，并<br />
据此加入支持奥巴马的团体。戈伦博格说：“这些集会吸引了社区人群的极大兴趣。人们一回家就上网捐款。而这些人以前从没卷入过竞选活动。”相形之下，奥巴<br />
马的党内对手——希拉里，也在自己的官方网站上设置了类似的“邮编定位”功能，以聚拢和发展支持者，但效果远逊于奥巴马。这里的原因是，奥巴马进入了<br />
Web2.0 时代，通过技术手段更方便地让人在虚拟空间中进行交流。</p>
<p>在奥巴马的官方网站中，有一项支持者分布地图，通过分布者地图，支持者们可以很方便地相互联系，也可以在网站里交流信息、建立博客、召开网上集会<br />
等。除此之外，奥巴马在互联网上几乎无所不在，Facebook、Myspace、YouTube、Digg、flickr、Twitter这些眼下最火<br />
的Web2.0 网站上都有奥巴马的身影。</p>
</p>
<p>在Myspace上，奥巴马有超过34万的好友，在Facebook上，支持者的数量接近76万，在YouTube上提供的奥巴马的视频频道，总浏览量已经超过了1300万，即使如Twitter这样的非主流的迷你博客，奥巴马也获得了2万多人的关注。</p>
</p>
<p>竞选从来都是一次大规模的社交活动，或者说是一次大规模的信息交互运动。候选人通过发送信息来确立自己的支持者，也通过接受信息来调整自己的形象和立场。而所有涉及信息的东西，必然被互联网时代所改变。</p>
</p>
<p>或许奥巴马的例子我们可以推演到整个商业社会，社交是人类所有活动的基础，当这种基础开始随着互联网的发展而产生变化的时候，网络社交演化出那些眼<br />
花缭乱的商业模式其实开始变成了小事。人们需要看到的是，社交的未来将会给商业组织的内涵和外延的表现形式带来改变，而一些传统商业规则和思路也必将面临<br />
着调整与重建。</p>
</p>
<div class="article-title" align="center"><strong><font style="font-size: 24px;">网络社交改变了什么</font></strong></div>
<div class="article-title"> </div>
<div class="article-author" align="right">杜晨,李黎</div>
</p>
<div class="imgborder">
<div>
<div class="galleryimage" align="center"><font color="#009999"><img alt="QQ缩减了交流成本,个人的影响力门槛也逐渐降低" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115430265658766.jpg" name="4985" /></font></div>
<div class="img_description" align="center"><font color="#009999">QQ缩减了交流成本，个人的影响力门槛也逐渐降低</font></div>
<div class="galleryimage" style="display: none;" align="center"><font color="#009999"><img alt="以前,我们要亲自参加社交活动" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115432646218458.jpg" name="4986" /></font></div>
<div class="img_description" style="display: none;" align="center"><font color="#009999">以前，我们要亲自参加社交活动</font></div>
<div class="galleryimage" style="display: none;" align="center"><font color="#009999"><img alt="现在,我们用虚拟身份交流" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115440244021192.jpg" name="4987" /></font></div>
<div class="img_description" style="display: none;" align="center"><font color="#009999">现在，我们用虚拟身份交流</font></div>
<div class="galleryimage" style="display: none;" align="center"><font color="#009999"><img alt="未来,当现实与虚拟混合,社交是什么样" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115445078315016.jpg" name="4989" /></font></div>
<div class="img_description" style="display: none;" align="center"><font color="#009999">未来，当现实与虚拟混合，社交是什么样</font></div>
<div class="img_description" style="display: none;"> </div>
</div>
</div>
<div class="article-content">
<p>人类学家很早就了解到，世界上不同文化背景的人———从亚马逊流域的猎人兼采集者，到非洲的牧人———都拥有类似的社会模式。例如，人们都按照若干<br />
层“圈子”来组织自己的人际关系：最近的圈子被称作“死党”，他们称得上是真正的朋友，在最紧要的关头，他们会毫不犹豫地拉你一把。在真正的朋友以外的圈<br />
子是有某种“特殊联系”的意气相投者，这类人你也以朋友相称，他们会帮助你，但是他们会衡量最高成本是多少。而最外面的圈子——“熟人”人数更多当然联系<br />
也更为松散，他们也可以帮你，但是他们要考虑最低收益是多少。</p>
<div class="relatedLinks">
<div class="relatedLinksHead"> </div>
</div>
<p>对于所有人来说，“死党”、“朋友”、“熟人”的圈子是有极限的。比如万通董事局主席冯仑在他的《野蛮生长》一书中坦言这辈子的社交圈子总共超不过70人。</p>
</p>
<p>人们都知道朋友多了好办事，但是最终却只能有很有限的社交圈子，这是为什么？社交的成本自然是关键。你需要投入时间、金钱甚至感情去社交，所以如果有办法让你至少可以在时间和金钱层次降低社交的成本，那人们自然会乐此不疲。</p>
</p>
<p>简单来说，网络社交就是这么发展起来的，而随着社会的发展，原有的社交模式也正在快速的变革，其结果就是我们可以打保票，如果熟人的概念可以延伸到网络上，不再以握过手和知道真名实姓来定义，那么冯仑的孩子的社交圈子肯定比他多。</p>
</p>
<p>当然，社交的未来不仅仅意味着个体社交圈子的数量变化，因为个体的变化必然带来社会各级组织形态的变异。</p>
</p>
<p><strong>越来越模糊的组织边界</strong></p>
<p>新东方在线的运营总监潘欣自2000年在互联网泡BBS以来，社交圈正在快速膨胀。在中国的几个主流的社交网站中，潘欣都是其中的活跃人物。在校内网他有约150个好友，在海内上他有超过340个好友，这些虚拟空间中的朋友很多都是现实朋友的延伸。</p>
</p>
<p>真正吸引潘欣的是交流沟通成本的降低。沙龙、俱乐部、舞会、酒会等形式都是不断演进着的社交方式，但是自始至终没法改变的就是高成本和低效率。但<br />
是，互联网却提供了这样一种低成本、无地域沟通的可能，潘欣和朋友的交流再也不需要现实的空间和整块的时间，他只要去别人的空间和博客留言或是发一封邮件<br />
就行。</p>
</p>
<p>虽然潘欣还是坚持着“三圈理论”，核心的还是那些在现实中的朋友。不过，潘欣承认即便是外层关系圈的“低成本延展”也是很有意义的事情。实际上，人<br />
类社会主要就是由无数外层关系圈组成，这个圈子很多时候是以某种组织的形态出现的，比如社团，再比如企业，而新的社交方式正在让这些组织的形态产生变化。</p>
</p>
<p>今天，当某些社会新闻中的个体在猫扑的论坛中引起争议时，就会有人倡议“呼唤人肉搜索”将相关人的资料全部查出公开在网络上，参与“人肉搜索”的大<br />
都是相互间不认识的个体，他们可能不在同一个城市，但是为了共同的目的进行同一项工作。对他们来说体验侦探的快感和偷窥到别人隐私的莫名兴奋感和成就感是<br />
支撑他们完成这个工作的原始动力。很多时候，他们关注的不是事件本身的具体意义，而是关注自己将在其中扮演什么样的角色，在网络上引发出的漩涡效应会有多<br />
大。</p>
</p>
<p>通常，这些“人肉搜索”的效率都相当的高，而且配合默契，他们就像是一支爵士乐团，每个人都在即兴发挥着自己的才能，最后却得出一个让他们满意的结果。这种中国的“人肉搜索”就是维基式的大规模协作，只不过在娱乐化的中国互联网里通过这种形式表现了出来。</p>
</p>
<div class="top_img_385" style="float: right; margin-left: 10px;"><img style="margin: 4px auto; display: block; text-align: center;" alt="一名普通人在Facebook上的社交关系图.也许未来人类的社交也可以用数据模型来解读" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115415583526655.jpg" /></p>
<div class="imgNote"><font color="#009999">一名普通人在Facebook上的社交关系图。也许未来人类的社</font></div>
<div class="imgNote" align="center"><font color="#009999">交也可以用数据模型来解读</font></div>
</div>
<p>未来的网络社交其实可以通过有效的引导将这种娱乐化的、恶作剧式的大规模协作以正向的方式表现出来。比如周鸿祎在做的360安全卫士，就想依靠社区的力量让社区中的个体充当木马病毒的侦查员，以群体的智慧来与病毒做战。</p>
<p>“我们是在做发动群众的工作，群防群治。”周鸿祎认为要让个体组成大规模的协作型组织，就必须将自己做成一个社区，在这个社区中让所有的成员都减小<br />
相互之间的沟通成本，最为重要的是让他们能够形成一个共同的理念和价值观，这样，他们才有可能不计报酬地为某个事业奉献出自己的智慧和能力。</p>
<p>网络社交带来的低成本大规模协作改变了个人与个人、个人与组织之间的关系，这个关系的变化同样也可以推演到组织与组织之间。因为，透过更低的沟通成本和更高的沟通效率，若干个社群与组织的联系也有变化的可能。</p>
</p>
<p>最近的例子是，Facebook等社交网站的底层代码语言PHP，由于更适合超大型网站的底层构架，随着Facebook的崛起获得了更高的重视，<br />
但PHP程序员比Java程序员少，技术出身的康盛创想科技公司CEO戴志康就发起了PHPChina社区，利用社交网络的力量聚集优秀的PHP工程师，<br />
也为自己的公司发掘人才。社交网络实际上已经成为技术创新的最新的组织方式。</p>
</p>
<p>这种现象在“很不IT”的传统行业也在出现。目前正在快速扩张的服装零售公司ITAT，他们通过透明的互联网及IT系统将大量的服装供应商、地产商<br />
联系起来，并用分账的方式与他们共享利益。虽然这种模式中分享利益是关键，但是如果没有透明和低成本的沟通方式（开放的IT平台），一群在资本上不相干，<br />
交情上不算深的企业也不可能走到一起来做生意。</p>
</p>
<p>其实ITAT与供应商及地产商就是通过新的“企业间社交”形成了一个透明开放的社区，这种通过透明、分享的社区方式使得作为组织者的ITAT在两年的时间里，在中国开了近800家门店，成为了全世界扩张最快的连锁集团——虽然他的背后靠的是一大群“外圈朋友”。</p>
</p>
<p>与周鸿祎通过相同价值观塑造的不计回报的“内圈朋友”不同，维系这些朋友的是ITAT能够用最低沟通成本，让人家算清楚收益的开放的信息平台。</p>
</p>
<p>说到底，人类学家的“圈子理论”在人类的企业身上同样适用。</p>
</p>
<p><strong>越来越细分的人群</strong></p>
<p>在现实世界中划分一个人群有很多标准，他们的年龄、性别、收入、地理位置甚至包括价值观和信仰。但是这些人群是一个“沙子一般的概念”——你知道他在那里，但是走近一看，人群还是分散的个体。</p>
</p>
<p>要让沙子变成有关联的整体，办法就是给它们加水，而要让人群变成有关联的社区，办法也类似，让他们开始“灌水”——通过彼此的沟通形成有联系的社区。</p>
</div>
<div class="source"> </div>
<div class="source">
<p>在现实世界中形成社区并不是一件容易的事情，首先是彼此间的交流很麻烦，成本很高，其次是构建社区的社交过程中干扰因素太多，让他们难以被捏合。比<br />
如你以性别划分的时候，他们的收入水平差距太大，你以地域划分的时候他们的年龄跨度可能又成了问题，这就是为什么现实世界中真正的社区型组织凤毛麟角，只<br />
有政党和宗教这样的信仰层次的统一才能建立稳固的社区。</p>
</p>
<p>不过网络社交正在改变这一概念。首先是沟通的低成本与高效率，降低了一个社群建立的成本。在那些虚拟的空间中建立自己的一个社群或是社区只是点击几<br />
下鼠标那么简单。潘欣在海内上就已建立了4个主题不同的群组，并加入了另外的15个群组。而在现实之中，个体要建立或是加入一个社群或是组织，几乎是不可<br />
想象的。</p>
<p>与此同时，以共同的爱好形成社区组织，在如今的社交网络中也开始广泛出现。这种组织可以包容不同的年龄、性别、收入、地理位置甚至是价值观和信仰，他们往往以简单的爱好为纽带，通过分享这种双向沟通机制联系起来。</p>
</p>
<p>毫无疑问，自发在互联网上形成有规模及影响力的社群，最为成功的一个例子是以美国苹果公司的iPod产品为中心的iPod俱乐部，这个在互联网上自发成立的组织人数达到了数十万人，分布在世界各地，他们为苹果这家商业公司带来了巨大的口碑价值。</p>
</p>
<div class="top_img_385" style="float: left; margin-right: 10px;"><img alt="美国民主党总统候选人奥巴马充分利用网络社交的优势,获得了大批的支持者" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115421660658613.jpg" /></p>
<div class="imgNote"><font color="#009999">美国民主党总统候选人奥巴马充分利用网络社交的优势，</font></div>
<div class="imgNote"><font color="#009999">获得了大批的支持者</font></div>
</div>
<p>不过网络社区的真正特点是几乎可以极度细分，并且以小规模的核心人群影响大规模的非核心人群。在很多互联网公司中，都有一项用户点评的功能，比如在<br />
携程或是在淘宝上，每个预定酒店或是购物的人，都会看一看前面的用户对某个酒店或是商家的评价，尽管真正产生内容的人也许只占到总消费者的1%不到，但是<br />
他们的评价和意见会大大影响着其后用户产生的商业行为。这也就是那些在互联网上的意见领袖所具有的核心价值。</p>
</p>
<p>对于企业来说，这意味着一个新的机会。那就是自己的产品和服务有可能在这种分众化的趋势下，更精确地送达和更准确地定制。两年前，两名在行业上几乎<br />
没有任何关联的浙江商人达成了一个合作，在虚拟的网络游戏中卖真实的牛肉干。通过游戏内容的设置，玩家可以在虚拟的游戏世界里通过点卡和货到付款的方式买<br />
到真实的牛肉干。传统企业利用网络社区的融合与互动的特性成为了最有效、最经济的营销手段。借助网络这个新平台，可以使客户和市场大幅度扩展。</p>
</p>
<p>但是这种机会并不是所有企业都可把握的。细分的人群带来了精准营销的机会，怎样找到他们，如何与他们做生意，这意味着一种全新的能力。在这一点上，大企业往往没有小公司反应的速度快。</p>
</p>
<p>很多人不知道，和通常的论坛里交流时尚的信息不同，淘宝论坛里的帖子更具商业目的，它们对商品的销量的刺激是不言而喻的，比如不久前论坛中出现一张<br />
章子怡穿着晚礼服和富豪男友出席好莱坞时尚晚宴的照片后，引发了淘宝社区展开一场大讨论，大家会对章子怡那部面目不清的手机进行一场数码大搜索，最终将目<br />
标锁定在去年流行的一款黑莓手机上。当然最高兴的是淘宝上的黑莓手机的卖家，章子怡相当于免费给他们做了广告。</p>
</p>
<p>其实，发贴子的就是那些卖家，他们希望如果你渴望拥有和章子怡一样的通信工具，不仅可以点击进楼主的店铺，还可以顺便到帖子页面右手边广告位里林立的手机店铺里瞧瞧。</p>
</p>
<p>在淘宝社区，这类的帖子数不胜数，大S最爱的面膜、女明星最喜爱的手袋、韩剧女主角的发饰，都是网友们追捧的热帖。最近很火爆的帖子是刚热播过的电视剧《奋斗》中女主角的T恤。</p>
</p>
<p>这些卖家的行为并没有什么理论指导，但是他们的“小伎俩”却在开辟新的理论。互联网给建立大量动态的、可以迅速汇集的社区提供了可能，进而可以筛选出更精准的人群和更好的营销效果。而如何利用这种越来越细分的社区来进行营销，对大企业来说同样是个很有价值的问题。</p>
</p>
<p><strong>越来越强大的个体</strong></p>
<p>有这么一个姑娘，名叫西施。她是一个白领，白天她在写字楼里上班，闲暇时写写博客，工作走神时还偷偷溜到淘宝上去溜达一圈，看看最新的某个品牌的服装是不是很便宜。</p>
</p>
<p>其实西施有一个自己的电子商务网站，但并不是她自己建的，而是在一个网站上注册后自动生成的，西施可以在五六分钟内就拥有一个电子商务平台，并且自动匹配了各种产品。她不知道这些产品的供应商是谁，是哪个商家匹配给她的，她甚至不需要去管理这个店，一切都是自动生成的。</p>
</p>
<p>不过西施要做的事情是将这个自动生成的网站在她的社交圈中进行推广。西施可以将这个电子商务网站链接到自己的博客里，也可以邀请朋友到她的网店中来<br />
参观。如果通过她的这个平台成交，她都会通过这个第三方平台——即自动给她匹配产品的网站进行销售分成。而后台是完全对她透明的。</p>
</p>
<p>这是一家名为九橙世纪的公司正在推广的基于分账模式的电子商务平台，他们把单个个体都看成了是一个媒介，通过分账的方式让每一个人都成为了产品的推<br />
销员。这种模式突然之间，把媒介的范围变得广阔起来，而共同获利则成为黏合剂，通过透明对等的信息交流机制，所有的个人和所有的企业，都有可能建立起推广<br />
分账关系，只要你足够有影响力，就具有更多的商业价值。</p>
</p>
<p>在现实世界中，利用个体的力量和个体的社交圈来销售产品的模式已经存在很多年，这种模式叫直销。不过直销的局限性在于个体的影响力是有限的，能直接销售出的产品的数量也是有限的，所以为了保证每个个体的动力，多层提成的传销才会出现。</p>
</p>
<p>但是网络社交正在给每个个体带来更低的社交成本和更大的社交圈子，降低了个人影响力的门槛。这显然让“人人都是推销员”成为了可能。因为在互联网创<br />
造的社区中，每个人都可以成为中心，他们可以通过各种技术工具在虚拟空间中展示自己，并以此影响着身边的群体。而在传统零售业，消费者个体之间的相互影响<br />
力是极弱的。他们在POS机前结账之后就如流沙一般四处散开，来来往往的陌生人很难就某款商品进行交流和心得分享，尽管他们或许在同一时间聚集在一座大百<br />
货公司里。</p>
</p>
<p>个体能量释放带来的不仅仅是“个人渠道”的出现。它带来的另一个结果就是让人力资源更合理也更有效地发挥作用。</p>
</p>
<p>网络使得每个人都能发挥出自己的优点，就像前述提到的“人肉搜索”的例子，个体之间在能够释放自己能量的环境中可以像一支即兴演奏的爵士乐团达到和谐，这与过去的传统的军乐型的商业组织有着很大的差别。</p>
</p>
<p>智能汉化翻译软件《东方快车》的创始人何恩培，在去年建立了一个基于互联网及IT管理技术的翻译公司。通过互联网，这家叫做传神的公司将接到的翻译<br />
任务分割成小块传输给在网站上注册的不同地域的兼职译员们，经由译员的翻译后，再辅以传神的质量管理系统及流程控制系统将分散的条块组合。</p>
</p>
<p>这种通过互联网分发及完成任务的方法可以提高规模化处理能力。传神日均处理的翻译字数能达到50万至2000万字的范围，是传统的翻译公司日处理字<br />
数的几十倍。并且由于采用了大规模协作的方式，完成一个任务所付出的人工成本也能降低到最小，因为他们能够选择那些翻译质量既高而且收费又少的译者。</p>
</p>
<p>很多人说网络社交的一个吸引人之处就在于可以选择展示自己最吸引人的一面，而在现实世界中会制约社交结果的很多因素，比如长相、性别、学历、收入统统不会在互联网上成为阻碍。这直接造成的结果就是在现实世界中的社交能力和风格在网络社交中也很有可能被翻转。</p>
</p>
<p>这种在社交上的不同，必然会影响到人们的工作和组织的形态。它会让人们在未来获得更广阔的工作空间，也让企业有了高效率配备人力资源的可能。</p>
</p>
<p>回到前面提到的西施姑娘身上，在现实世界中她并不是一个出色的推销员，也不一定就是那么亲切善谈，很可能根本就不愿意真的去上门推销产品，但是在网络的平台上，西施姑娘绝对是个好员工，而且还是在快乐地工作。</p>
</p>
<div class="article-title" align="center"><font style="font-size: 24px;"><strong>社交网络考古</strong></font></div>
<div class="article-title" align="center"> </div>
<div class="article-author" align="right">成远</div>
<div class="article-author"><img style="width: 500px; height: 733px;" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115454682399575.jpg" /></div>
<div class="article-content">
<p>网络社交的起始点在什么位置？</p>
</p>
<p>当然是电子邮件。互联网本质上就是计算机之间的联网，早期的E-mail解决了远程的邮件传输的问题，至今它也是互联网上最普及的应用，同时它也是<br />
网络社交的起点，人们因此在无法见面的时候除了写信和打电话外有了一个更低成本和更方便的交流方式。另外它引入的“群发”、“转发”等模式也放大了个体信<br />
息传输节点的能量。但在这一点上邮件有很大的人群局限性，你只能向知道地址的人传输信息和进行社交活动，否则往往被称作垃圾邮件。</p>
<div class="relatedLinks">
<div class="relatedLinksHead"> </div>
</div>
<p>之后的BBS则更进了一步，把“群发”和“转发”常态化，理论上实现了向所有人发布信息并讨论话题的功能（疆界是BBS的访问者数量）。它把网络社交推进了一步，从单纯的点对点交流的成本降低，推进到了点对面交流成本的降低。</p>
</p>
<p>接下来的即时通信（IM）和博客（Blog）更像是前面两个社交工具的升级版本，前者提高了即时效果（传输速度）和同时交流能力（并行处理）；后者<br />
则开始体现社会学和心理学的理论——信息发布节点开始体现越来越强的个体意识，因为在时间维度上的分散信息开始可以被聚合，进而成为信息发布节点的“形<br />
象”和“性格”。</p>
</p>
<p>后面发生的事情基本上都是在这两个基础上进一步的完善和延展。比如从RSS、Del.icio.us、flickr到最近的YouTube、Digg、Mini-feed、Twitter、Video-Mail厖他们都解决或改进了单一功能，是丰富网络社交的工具。</p>
</p>
<p>随着网络社交的悄悄演进，一个人在网络上的形象更加趋于完整，这时候SNS（Social Network Service）出现了。</p>
</p>
<p>交友只是SNS的一个开端，就像Google的开端只是每个网页的backlinks那么普通一样，SNS的开端只是获取你的个人资料和好友列表。<br />
社交网站大体经历了这样一个发展过程：早期概念化阶段──SixDegrees代表的六度分隔理论；结交陌生人阶段──Friendster帮你建立弱关<br />
系从而带来更高社会资本的理论；娱乐化阶段──MySpace创造的丰富的多媒体个性化空间吸引注意力的理论；社交图阶段──Facebook复制线下真<br />
实人际网络来到线上低成本管理的理论。整个SNS发展的过程是循着人们逐渐将线下生活的更完整的信息流转移到线上进行低成本管理，这让虚拟社交越来越与现<br />
实世界的社交出现交叉。</p>
</p>
<p>麦克·卢汉曾经讲过，电子媒介的出现会让世界走向“部落化”，变成“地球村”。人类通信媒介的变化的确如麦克·卢汉的预言，在电报、电话出现之前，<br />
信息传递的速度从没有超过马奔跑的速度；广播电视、互联网的出现让我们几乎在第一时间接收到信息，这在报纸时代是不可想像的。人类历史上，大凡重要的技术<br />
革命都伴随媒介革命，人类任何活动本质上都是信息活动，信息流的传递介质、管理方式的不同将决定你接受信息的不同，所有有关信息流媒介的变革一定是底层的<br />
变革——网络社交也是如此。</p>
</p>
<p>今天一个典型美国网民每天早上要看的三处信息，他们分别是E-mail、Google<br />
News和Facebook的Mini-feed，它们分别代表“公司发生的事”、“世界发生的事”和“身边发生的事”。在Facebook出现之前，最<br />
后一项信息的获取成本很高，可能你要看很多邮件，用IM花不少时间聊天或者看很多朋友的博客才能知道个大概，而现在管理这些关系，了解他们的信息变得非常<br />
低成本。</p>
</p>
<p>从网络社交的演进历史来看，它一直在遵循“低成本替代”原则。网络社交一直在降低人们社交的时间和物质成本，或者说是降低管理和传递信息的成本。与<br />
此同时，网络社交一直在努力通过不断丰富的手段和工具，来替代传统社交来满足人类这种社会性动物的交流需求，并且正在按照从“增量性的娱乐”到“常量性的<br />
生活”这条轨迹不断接近基本需求。</p>
</p>
<p>如果说在网络社交的起点——电子邮件时代，它仅仅可以满足人们5%的社交需求，那么今天丰富的社交网络已经可以把这个数字至少提升了10倍，除了<br />
“接触型”的社交行为，或者说是“接触型”信息的收集和发布之外，网络社交已经开始承担大部分传统社交的作用。实际上，“非接触型”的社交原本就占据了人<br />
类社交的80%以上，这意味着网络社交对传统世界必然会带来巨大的影响。</p>
</p>
<p>说到底，网络社交不仅仅是一些新潮的商业模式，从历史维度来看，它更是一个推动互联网向现实世界无限靠近的关键力量。</p>
</p>
<div class="article-title" align="center"><font style="font-size: 24px;"><strong>Facebook 中国追随者们还要等6年</strong></font></div>
<div class="article-title" align="center"> </div>
<div class="article-author" align="right">成远</div>
</p>
<div class="imgborder">
<div>
<div>
<p class="galleryimage" align="center"><img alt="Facebook之所以成功,关键在于将现实关系带入了虚拟的网络中" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115470259440504.jpg" name="4991" /></p>
<div class="img_description" align="center"><font color="#009999">Facebook之所以成功，关键在于将现实关系带入了虚拟的网络中</font></div>
<div class="img_description"> </div>
</div>
</div>
</div>
<div class="article-content">
<p>自Facebook获得微软及李嘉诚的3.6亿美元投资以来，社交风潮至今都没有停歇过。现在中国的互联网圈最热的议题也都和社区、社交有关。社交<br />
网络在互联网上的“繁殖”也像野生蘑菇那样疯长。谢文的一起、王兴的海内、麦田的蚂蚁、陈一舟的校内、庞升东的51、张帆的占座、杨勃的豆瓣、戴志康的<br />
UChome&#8230;&#8230;</p>
<div class="relatedLinks"> </div>
<div class="top_img_150" style="float: right; margin-left: 10px;"><img alt="陈一舟通过收购建立了一个低龄娱乐化的社区" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115471776761823.jpg" /></p>
<div class="imgNote"><font color="#009999">陈一舟通过收购建立了</font></div>
<div class="imgNote"><font color="#009999">一个低龄娱乐化的社区</font></div>
</div>
<p>其实，目前中国最大的社交网站还要说腾讯的QQ空间，其活跃账号超过1亿，按照平均每名用户1.7个QQ账号来计算，其活跃用户数量在6000万以<br />
上。一些用户基本数据其实可以告诉我们一些关于行业的重要事实：据腾讯统计数据显示，QQ空间用户群的注册年龄主要为18~30岁，平均年龄24岁。</p>
</p>
<p>这个数据实际上告诉了我们中国互联网距离进入“生活网”、“商务网”的时代还有几年时间。从用户年龄看，Facebook已经不是一个纯粹面向大学<br />
生的社交网站了，其用户平均年龄达到35<br />
岁，商业价值巨大。按照一般经验，一个社会的高消费群体主要集中在30~40岁的年龄层，距离腾讯QQ空间的主流用户年龄还差6年，按照51庞升东的说<br />
法，51空间的用户平均年龄要比QQ空间用户大2~3岁，就是说51.com的2600万活跃用户进入主流消费人群还有3年的时间。这还没将未来2~3年<br />
或者5~6年内，中国的网民数量的增长考虑在内，这个增长会大得惊人，2007年一年中国网民就增加了7000万，网民总数达到2.1亿。</p>
</p>
<div class="top_img_150" style="float: left; margin-right: 10px;"><img alt="学社会学的谢文终于在今年开始实践自己的社区理想" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115473646703230.jpg" /></p>
<div class="imgNote"><font color="#009999">学社会学的谢文终于在今</font></div>
<div class="imgNote"><font color="#009999">年开始实践自己的社区理想</font></div>
</div>
<p>实际上，一个4亿注册账号的QQ即时通信保证着腾讯的用户不会轻易放弃这上面的社会关系，习惯使用互联网管理社交信息的低龄用户基本上会平滑过度到中间年龄的职业群体、商务人士和主流消费者的身份。</p>
</p>
<p>腾讯新闻业务在去年迅速崛起，通过IM的新闻弹出窗口加大腾讯新闻的支持力度以来，并不是人们想象的娱乐新闻主导，而是财经、科技、社会新闻都成为<br />
用户点击量很高的内容。今年5月的腾讯广告年会，将力推腾讯新闻产品，马化腾历来是看到产品流量有了真正增长，才会投钱做推广的。事实上，这意味着QQ空<br />
间产品的用户已经开始关心社会主流话题，这是这个群体进入主流社会的前奏和准备。</p>
</p>
<p>2004年的一拨SNS产品几乎都死掉了，2005年开始创业的一批，只有校内网和51发展得不错。校内网避免了腾讯的直接冲撞，但是由于主流职业<br />
人群和商务人士完全转向用互联网维持社交信息流还存在一个时间差，即上述数据推算出的2~6年，因此校内网向白领用户扩张效果不太明显。51.com在腾<br />
讯的眼皮底下做到目前2600万活跃用户的规模被业界视为奇迹，但指望让目前年龄稍大、有更高收入和购买力的人上51.com不太现实。</p>
</p>
<div class="top_img_150" style="float: right; margin-left: 10px;"><img alt="占座网的CEO张帆最早打出中国Facebook的口号" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115480992790876.jpg" /></p>
<div class="imgNote"><font color="#009999">占座网的CEO张帆最早打</font></div>
<div class="imgNote"><font color="#009999">出中国Facebook的口号</font></div>
</div>
<p>相比于2005年的博客和Web2.0热，2006年的网络视频热，此轮SNS热并没有那么强烈的浮躁感。虽然也报出一些网站被收购等虚假新闻炒<br />
作，但大家多数不会当真。这一方面是因为SNS网站从2005年到2007年一直都没有像博客和视频网站那样经历过大火，三年多市场淘汰了不少网站，也教<br />
育了许多年轻的创业者。</p>
</p>
<div class="top_img_150" style="float: left; margin-right: 10px;"><img alt="51.com的庞升东对通过用什么手段吸引用户有一套独特的做法" src="http://www.ceocio.com.cn/pubsystem/uploadfile/200804/2008042115482429333845.jpg" /></p>
<div class="imgNote"><font color="#009999">51.com的庞升东对通过</font></div>
<div class="imgNote"><font color="#009999">用什么手段吸引用户有</font></div>
<div class="imgNote"><font color="#009999">一套独特的做法</font></div>
</div>
<p>另一方面，经过三年的发展，2005年左右创业，坚持到今天的社交网站已经逐渐摸索出盈利模式，学会了赚钱。51.com上已经开设了百事、耐克等<br />
品牌的空间，用户加这些品牌为好友，就能参与互动活动，品牌厂商每月付给51.com10万元的费用。庞升东形容51对品牌厂商来说是个规模庞大的<br />
CRM，企业可以了解上百万消费者的偏好，任何消费者调查都难以获得这么多信息。</p>
<p>虽然每个品牌空间的开通可以给51.com带来每年上百万元的年费收入，但51.com的2/3<br />
的收入来源还是虚拟物品交易、交友增值服务等收入。因此我们认为，按照中国网民和目前最强大的社交网络企业──腾讯和51.com的发展状况来看，2~6<br />
年后这个市场成为生活网和商务网上的潜力才能充分爆发，而这也是因为“网络社交”对现实世界的全面影响将会得到更大规模的释放。</p>
</p>
<p>实际上，网络不能给你提供衣食住行的物理商品，但所有关于衣食住行，甚至社交、精神文化的信息流都在逐渐向线上转移的趋势已经注定，并且出现了不少愿为其付钱的广告客户和消费者。</p>
</p>
<p>随着2~6年后，80后、90后们变成主流职业人群和消费市场的中坚力量，社交网络改变人们现实生活底层的信息流动方式的革命性价值会更加凸显出<br />
来，那时候在互联网下长大的一代将如何使用互联网来管理自己的生活和社交，其价值不可估量，甚至是上一代人难以想象的。谢文刚刚创办的一起网就是试图做这<br />
一趋势下的先行者。康盛创想旗下的产品，包括管理着50多万BBS的Discuz软件，最近一次的升级是以往版本升级中耗时最长的一次，从去年8月就开<br />
始，最近才刚刚完成。原因就是康盛创想的CEO戴志康意识到，在中国互联网最终变成“生活网”和“商务网”，而非单纯的“娱乐网”和“交友网”之前，提前<br />
2到3年布局可以说是正逢其时。</p>
<div class="source"> </div>
</div>
<div class="source">来源：<a target="_blank" href="http://blog.sina.com.cn/s/blog_502e94a101008zis.html">http://blog.sina.com.cn/s/blog_502e94a101008zis.html</a></div>
</div>
</div>
</div>
</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2011/07/30366.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>世界各国域名后缀大全</title>
		<link>http://blog.so8848.com/2011/06/27748.html</link>
		<comments>http://blog.so8848.com/2011/06/27748.html#comments</comments>
		<pubDate>Sun, 19 Jun 2011 14:28:46 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[互联网1]]></category>
		<category><![CDATA[信息检索]]></category>
		<category><![CDATA[域名]]></category>

		<guid isPermaLink="false">http://www.5yiso.cn/2008/04/27748.html</guid>
		<description><![CDATA[.ac 耶稣升天岛 .cu 古巴 .ie 爱尔兰 .mu 毛里求斯 .sm 圣马力诺 .ad 安道尔共和国 .cv 佛得角 .il 以色列 .mv 马尔代夫 .sn 塞内加尔 .ae 阿联酋 .cx 圣诞岛 .im 怀特岛(?) .mw 马拉维 .so 索马里 .af 阿富汗 .cy 塞浦路斯 .in 印度 .mx 墨西哥 .sr 苏里南 .ag 安提瓜/巴布达岛 .cz 捷克 .io 英属印度洋领地 .my 马来西亚 .st 圣多美和普林西比 .ai 安圭拉岛 .de 德国 .iq <a href='http://blog.so8848.com/2011/06/27748.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<table class="t_table" style="width: 98%;" cellspacing="0">
<tbody>
<tr>
<td width="6%">.ac</td>
<td width="13%">耶稣升天岛</td>
<td width="7%">.cu</td>
<td width="14%">古巴</td>
<td width="7%">.ie</td>
<td width="15%">爱尔兰</td>
<td width="6%">.mu</td>
<td width="17%">毛里求斯</td>
<td width="6%">.sm</td>
<td width="9%">圣马力诺</td>
</tr>
<tr>
<td width="6%">.ad</td>
<td width="13%">安道尔共和国</td>
<td width="7%">.cv</td>
<td width="14%">佛得角</td>
<td width="7%">.il</td>
<td width="15%">以色列</td>
<td width="6%">.mv</td>
<td width="17%">马尔代夫</td>
<td width="6%">.sn</td>
<td width="9%">塞内加尔</td>
</tr>
<tr>
<td width="6%">.ae</td>
<td width="13%">阿联酋</td>
<td width="7%">.cx</td>
<td width="14%">圣诞岛</td>
<td width="7%">.im</td>
<td width="15%">怀特岛(?)</td>
<td width="6%">.mw</td>
<td width="17%">马拉维</td>
<td width="6%">.so</td>
<td width="9%">索马里</td>
</tr>
<tr>
<td width="6%">.af</td>
<td width="13%">阿富汗</td>
<td width="7%">.cy</td>
<td width="14%">塞浦路斯</td>
<td width="7%">.in</td>
<td width="15%">印度</td>
<td width="6%">.mx</td>
<td width="17%">墨西哥</td>
<td width="6%">.sr</td>
<td width="9%">苏里南</td>
</tr>
<tr>
<td width="6%">.ag</td>
<td width="13%">安提瓜/巴布达岛</td>
<td width="7%">.cz</td>
<td width="14%">捷克</td>
<td width="7%">.io</td>
<td width="15%">英属印度洋领地</td>
<td width="6%">.my</td>
<td width="17%">马来西亚</td>
<td width="6%">.st</td>
<td width="9%">圣多美和普林西比</td>
</tr>
<tr>
<td width="6%">.ai</td>
<td width="13%">安圭拉岛</td>
<td width="7%">.de</td>
<td width="14%">德国</td>
<td width="7%">.iq</td>
<td width="15%">伊拉克</td>
<td width="6%">.mz</td>
<td width="17%">莫桑比克</td>
<td width="6%">.su</td>
<td width="9%">苏联</td>
</tr>
<tr>
<td width="6%">.al</td>
<td width="13%">阿尔巴尼亚</td>
<td width="7%">.dj</td>
<td width="14%">吉布提</td>
<td width="7%">.ir</td>
<td width="15%">伊朗</td>
<td width="6%">.na</td>
<td width="17%">纳米比亚</td>
<td width="6%">.sv</td>
<td width="9%">萨尔瓦多</td>
</tr>
<tr>
<td width="6%">.am</td>
<td width="13%">美国</td>
<td width="7%">.dk</td>
<td width="14%">丹麦</td>
<td width="7%">.is</td>
<td width="15%">冰岛</td>
<td width="6%">.nc</td>
<td width="17%">新喀里多尼亚</td>
<td width="6%">.sy</td>
<td width="9%">叙利亚</td>
</tr>
<tr>
<td width="6%">.an</td>
<td width="13%">安的列斯群岛</td>
<td width="7%">.dm</td>
<td width="14%">多米尼加</td>
<td width="7%">.it</td>
<td width="15%">意大利</td>
<td width="6%">.ne</td>
<td width="17%">尼日尔</td>
<td width="6%">.sz</td>
<td width="9%">斯威士兰</td>
</tr>
<tr>
<td width="6%">.ao</td>
<td width="13%">安哥拉</td>
<td width="7%">.do</td>
<td width="14%">多米尼加共和国</td>
<td width="7%">.je</td>
<td width="15%">Jersey</td>
<td width="6%">.nf</td>
<td width="17%">诺福克岛</td>
<td width="6%">.tc</td>
<td width="9%">特克斯和凯科斯群岛</td>
</tr>
<tr>
<td width="6%">.aq</td>
<td width="13%">南极洲</td>
<td width="7%">.dz</td>
<td width="14%">阿尔及利亚</td>
<td width="7%">.jm</td>
<td width="15%">牙买加</td>
<td width="6%">.ng</td>
<td width="17%">尼日利亚</td>
<td width="6%">.td</td>
<td width="9%">乍得</td>
</tr>
<tr>
<td width="6%">.as</td>
<td width="13%">萨摩亚群岛</td>
<td width="7%">.ec</td>
<td width="14%">厄瓜多尔</td>
<td width="7%">.jo</td>
<td width="15%">约旦</td>
<td width="6%">.ni</td>
<td width="17%">尼加拉瓜</td>
<td width="6%">.tf</td>
<td width="9%">法国南部</td>
</tr>
<tr>
<td width="6%">.at</td>
<td width="13%">奥地利</td>
<td width="7%">.ee</td>
<td width="14%">爱沙尼亚</td>
<td width="7%">.jp</td>
<td width="15%">日本</td>
<td width="6%">.nl</td>
<td width="17%">荷兰</td>
<td width="6%">.tg</td>
<td width="9%">多哥</td>
</tr>
<tr>
<td width="6%">.au</td>
<td width="13%">澳大利亚</td>
<td width="7%">.eg</td>
<td width="14%">埃及</td>
<td width="7%">.ke</td>
<td width="15%">肯尼亚</td>
<td width="6%">.no</td>
<td width="17%">挪威</td>
<td width="6%">.th</td>
<td width="9%">泰国</td>
</tr>
<tr>
<td width="6%">.aw</td>
<td width="13%">阿鲁巴岛</td>
<td width="7%">.eh</td>
<td width="14%">西撒哈拉</td>
<td width="7%">.kg</td>
<td width="15%">吉尔吉斯斯坦</td>
<td width="6%">.np</td>
<td width="17%">尼泊尔</td>
<td width="6%">.tj</td>
<td width="9%">塔吉克斯坦</td>
</tr>
<tr>
<td width="6%">.az</td>
<td width="13%">阿塞拜疆</td>
<td width="7%">.er</td>
<td width="14%">厄立特里亚</td>
<td width="7%">.kh</td>
<td width="15%">柬埔寨</td>
<td width="6%">.nr</td>
<td width="17%">瑙鲁</td>
<td width="6%">.tk</td>
<td width="9%">托克劳群岛</td>
</tr>
<tr>
<td width="6%">.ba</td>
<td width="13%">波斯尼亚</td>
<td width="7%">.es</td>
<td width="14%">西班牙</td>
<td width="7%">.ki</td>
<td width="15%">基里巴斯</td>
<td width="6%">.nt</td>
<td width="17%">中立区</td>
<td width="6%">.tm</td>
<td width="9%">土库曼斯坦</td>
</tr>
<tr>
<td width="6%">.bb</td>
<td width="13%">巴巴多斯岛</td>
<td width="7%">.et</td>
<td width="14%">埃塞俄比亚</td>
<td width="7%">.km</td>
<td width="15%">科摩罗</td>
<td width="6%">.nu</td>
<td width="17%">纽埃</td>
<td width="6%">.tn</td>
<td width="9%">突尼斯</td>
</tr>
<tr>
<td width="6%">.bd</td>
<td width="13%">孟加拉国</td>
<td width="7%">.fi</td>
<td width="14%">芬兰</td>
<td width="7%">.kn</td>
<td width="15%">圣基茨和尼维斯</td>
<td width="6%">.nz</td>
<td width="17%">新西兰</td>
<td width="6%">.to</td>
<td width="9%">汤加</td>
</tr>
<tr>
<td width="6%">.be</td>
<td width="13%">比利时</td>
<td width="7%">.fj</td>
<td width="14%">斐济</td>
<td width="7%">.kp</td>
<td width="15%">北朝鲜</td>
<td width="6%">.om</td>
<td width="17%">阿曼</td>
<td width="6%">.tp</td>
<td width="9%">东帝汶</td>
</tr>
<tr>
<td width="6%">.bf</td>
<td width="13%">布基纳法索</td>
<td width="7%">.fk</td>
<td width="14%">福克兰群岛</td>
<td width="7%">.kr</td>
<td width="15%">南朝鲜</td>
<td width="6%">.pa</td>
<td width="17%">巴拿马</td>
<td width="6%">.tr</td>
<td width="9%">土耳其</td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bg</font></td>
<td width="13%"><font style="font-size: 10pt;">保加利亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.fm</font></td>
<td width="14%"><font style="font-size: 10pt;">密克罗尼西亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.kw</font></td>
<td width="15%"><font style="font-size: 10pt;">科威特</font></td>
<td width="6%"><font style="font-size: 10pt;">.pe</font></td>
<td width="17%"><font style="font-size: 10pt;">秘鲁</font></td>
<td width="6%"><font style="font-size: 10pt;">.tt</font></td>
<td width="9%"><font style="font-size: 10pt;">特立尼和多巴哥</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bh</font></td>
<td width="13%"><font style="font-size: 10pt;">巴林</font></td>
<td width="7%"><font style="font-size: 10pt;">.fr</font></td>
<td width="14%"><font style="font-size: 10pt;">法国</font></td>
<td width="7%"><font style="font-size: 10pt;">.ky</font></td>
<td width="15%"><font style="font-size: 10pt;">开曼群岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.pf</font></td>
<td width="17%"><font style="font-size: 10pt;">法属玻利尼西亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.tv</font></td>
<td width="9%"><font style="font-size: 10pt;">图瓦鲁</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bi</font></td>
<td width="13%"><font style="font-size: 10pt;">布隆迪</font></td>
<td width="7%"><font style="font-size: 10pt;">.fx</font></td>
<td width="14%"><font style="font-size: 10pt;">法国城市</font></td>
<td width="7%"><font style="font-size: 10pt;">.kz</font></td>
<td width="15%"><font style="font-size: 10pt;">哈萨克斯坦</font></td>
<td width="6%"><font style="font-size: 10pt;">.pg</font></td>
<td width="17%"><font style="font-size: 10pt;">巴布亚新几内亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.tw</font></td>
<td width="9%"><font style="font-size: 10pt;">台湾</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bj</font></td>
<td width="13%"><font style="font-size: 10pt;">贝宁湾</font></td>
<td width="7%"><font style="font-size: 10pt;">.ga</font></td>
<td width="14%"><font style="font-size: 10pt;">加蓬</font></td>
<td width="7%"><font style="font-size: 10pt;">.la</font></td>
<td width="15%"><font style="font-size: 10pt;">老挝人民共和国</font></td>
<td width="6%"><font style="font-size: 10pt;">.ph</font></td>
<td width="17%"><font style="font-size: 10pt;">菲律宾</font></td>
<td width="6%"><font style="font-size: 10pt;">.tz</font></td>
<td width="9%"><font style="font-size: 10pt;">坦桑尼亚</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bm</font></td>
<td width="13%"><font style="font-size: 10pt;">百慕大</font></td>
<td width="7%"><font style="font-size: 10pt;">.gb</font></td>
<td width="14%"><font style="font-size: 10pt;">格林纳达</font></td>
<td width="7%"><font style="font-size: 10pt;">.lb</font></td>
<td width="15%"><font style="font-size: 10pt;">黎巴嫩</font></td>
<td width="6%"><font style="font-size: 10pt;">.pk</font></td>
<td width="17%"><font style="font-size: 10pt;">巴基斯坦</font></td>
<td width="6%"><font style="font-size: 10pt;">.ua</font></td>
<td width="9%"><font style="font-size: 10pt;">乌克兰</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bo</font></td>
<td width="13%"><font style="font-size: 10pt;">玻利维亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.ge</font></td>
<td width="14%"><font style="font-size: 10pt;">格鲁吉亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.li</font></td>
<td width="15%"><font style="font-size: 10pt;">列支敦士登</font></td>
<td width="6%"><font style="font-size: 10pt;">.pl</font></td>
<td width="17%"><font style="font-size: 10pt;">波兰</font></td>
<td width="6%"><font style="font-size: 10pt;">.ug</font></td>
<td width="9%"><font style="font-size: 10pt;">乌干达</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.br</font></td>
<td width="13%"><font style="font-size: 10pt;">巴西</font></td>
<td width="7%"><font style="font-size: 10pt;">.gf</font></td>
<td width="14%"><font style="font-size: 10pt;">圭亚那地区</font></td>
<td width="7%"><font style="font-size: 10pt;">.lk</font></td>
<td width="15%"><font style="font-size: 10pt;">斯里兰卡</font></td>
<td width="6%"><font style="font-size: 10pt;">.pm</font></td>
<td width="17%"><font style="font-size: 10pt;">密克隆岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.uk</font></td>
<td width="9%"><font style="font-size: 10pt;">英国</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bs</font></td>
<td width="13%"><font style="font-size: 10pt;">巴哈马群岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.gg</font></td>
<td width="14%"><font style="font-size: 10pt;">格恩西岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.lr</font></td>
<td width="15%"><font style="font-size: 10pt;">利比里亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.pn</font></td>
<td width="17%"><font style="font-size: 10pt;">皮特克恩岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.um</font></td>
<td width="9%"><font style="font-size: 10pt;">美国边远小岛</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bt</font></td>
<td width="13%"><font style="font-size: 10pt;">不丹</font></td>
<td width="7%"><font style="font-size: 10pt;">.gh</font></td>
<td width="14%"><font style="font-size: 10pt;">加纳</font></td>
<td width="7%"><font style="font-size: 10pt;">.ls</font></td>
<td width="15%"><font style="font-size: 10pt;">莱索托</font></td>
<td width="6%"><font style="font-size: 10pt;">.pr</font></td>
<td width="17%"><font style="font-size: 10pt;">波多黎各</font></td>
<td width="6%"><font style="font-size: 10pt;">.us</font></td>
<td width="9%"><font style="font-size: 10pt;">美国</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bv</font></td>
<td width="13%"><font style="font-size: 10pt;">布韦岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.gi</font></td>
<td width="14%"><font style="font-size: 10pt;">直布罗陀</font></td>
<td width="7%"><font style="font-size: 10pt;">.lt</font></td>
<td width="15%"><font style="font-size: 10pt;">立陶宛</font></td>
<td width="6%"><font style="font-size: 10pt;">.pt</font></td>
<td width="17%"><font style="font-size: 10pt;">葡萄牙</font></td>
<td width="6%"><font style="font-size: 10pt;">.uy</font></td>
<td width="9%"><font style="font-size: 10pt;">乌拉圭</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bw</font></td>
<td width="13%"><font style="font-size: 10pt;">博茨瓦纳</font></td>
<td width="7%"><font style="font-size: 10pt;">.gl</font></td>
<td width="14%"><font style="font-size: 10pt;">格陵兰群岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.lu</font></td>
<td width="15%"><font style="font-size: 10pt;">卢森堡公国</font></td>
<td width="6%"><font style="font-size: 10pt;">.pw</font></td>
<td width="17%"><font style="font-size: 10pt;">帕劳</font></td>
<td width="6%"><font style="font-size: 10pt;">.uz</font></td>
<td width="9%"><font style="font-size: 10pt;">乌兹别克斯坦</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.by</font></td>
<td width="13%"><font style="font-size: 10pt;">白俄罗斯</font></td>
<td width="7%"><font style="font-size: 10pt;">.gm</font></td>
<td width="14%"><font style="font-size: 10pt;">冈比亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.lv</font></td>
<td width="15%"><font style="font-size: 10pt;">拉脱维亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.py</font></td>
<td width="17%"><font style="font-size: 10pt;">巴拉圭</font></td>
<td width="6%"><font style="font-size: 10pt;">.va</font></td>
<td width="9%"><font style="font-size: 10pt;">梵地冈</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.bz</font></td>
<td width="13%"><font style="font-size: 10pt;">伯利兹城</font></td>
<td width="7%"><font style="font-size: 10pt;">.gn</font></td>
<td width="14%"><font style="font-size: 10pt;">几内亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.ly</font></td>
<td width="15%"><font style="font-size: 10pt;">利比亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.qa</font></td>
<td width="17%"><font style="font-size: 10pt;">卡塔尔</font></td>
<td width="6%"><font style="font-size: 10pt;">.vc</font></td>
<td width="9%"><font style="font-size: 10pt;">圣文森特和格林纳丁斯</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.ca</font></td>
<td width="13%"><font style="font-size: 10pt;">加拿大</font></td>
<td width="7%"><font style="font-size: 10pt;">.gp</font></td>
<td width="14%"><font style="font-size: 10pt;">瓜德罗普岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.ma</font></td>
<td width="15%"><font style="font-size: 10pt;">摩洛哥</font></td>
<td width="6%"><font style="font-size: 10pt;">.re</font></td>
<td width="17%"><font style="font-size: 10pt;">Reunion(?)</font></td>
<td width="6%"><font style="font-size: 10pt;">.ve</font></td>
<td width="9%"><font style="font-size: 10pt;">委内瑞拉</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cc</font></td>
<td width="13%"><font style="font-size: 10pt;">科科斯群岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.gq</font></td>
<td width="14%"><font style="font-size: 10pt;">赤道几内亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.mc</font></td>
<td width="15%"><font style="font-size: 10pt;">摩纳哥</font></td>
<td width="6%"><font style="font-size: 10pt;">.ro</font></td>
<td width="17%"><font style="font-size: 10pt;">罗马尼亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.vg</font></td>
<td width="9%"><font style="font-size: 10pt;">维京群岛</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cd</font></td>
<td width="13%"><font style="font-size: 10pt;">扎伊尔</font></td>
<td width="7%"><font style="font-size: 10pt;">.gr</font></td>
<td width="14%"><font style="font-size: 10pt;">希腊</font></td>
<td width="7%"><font style="font-size: 10pt;">.md</font></td>
<td width="15%"><font style="font-size: 10pt;">摩尔多瓦</font></td>
<td width="6%"><font style="font-size: 10pt;">.ru</font></td>
<td width="17%"><font style="font-size: 10pt;">俄国</font></td>
<td width="6%"><font style="font-size: 10pt;">.vi</font></td>
<td width="9%"><font style="font-size: 10pt;">美国未开发小岛</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cf</font></td>
<td width="13%"><font style="font-size: 10pt;">中非共和国</font></td>
<td width="7%"><font style="font-size: 10pt;">.gs</font></td>
<td width="14%"><font style="font-size: 10pt;">乔治亚州(?)</font></td>
<td width="7%"><font style="font-size: 10pt;">.mg</font></td>
<td width="15%"><font style="font-size: 10pt;">马达加斯加</font></td>
<td width="6%"><font style="font-size: 10pt;">.rw</font></td>
<td width="17%"><font style="font-size: 10pt;">卢旺达</font></td>
<td width="6%"><font style="font-size: 10pt;">.vn</font></td>
<td width="9%"><font style="font-size: 10pt;">越南</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cg</font></td>
<td width="13%"><font style="font-size: 10pt;">刚果</font></td>
<td width="7%"><font style="font-size: 10pt;">.gt</font></td>
<td width="14%"><font style="font-size: 10pt;">危地马拉</font></td>
<td width="7%"><font style="font-size: 10pt;">.mh</font></td>
<td width="15%"><font style="font-size: 10pt;">马绍尔群岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.sa</font></td>
<td width="17%"><font style="font-size: 10pt;">沙特阿拉伯</font></td>
<td width="6%"><font style="font-size: 10pt;">.vu</font></td>
<td width="9%"><font style="font-size: 10pt;">瓦努阿图</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.ch</font></td>
<td width="13%"><font style="font-size: 10pt;">瑞士</font></td>
<td width="7%"><font style="font-size: 10pt;">.gu</font></td>
<td width="14%"><font style="font-size: 10pt;">关岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.mk</font></td>
<td width="15%"><font style="font-size: 10pt;">马其顿王国</font></td>
<td width="6%"><font style="font-size: 10pt;">.sb</font></td>
<td width="17%"><font style="font-size: 10pt;">所罗门群岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.wf</font></td>
<td width="9%"><font style="font-size: 10pt;">瓦利斯和富图钠群岛</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.ci</font></td>
<td width="13%"><font style="font-size: 10pt;">象牙海岸</font></td>
<td width="7%"><font style="font-size: 10pt;">.gw</font></td>
<td width="14%"><font style="font-size: 10pt;">几内亚比绍</font></td>
<td width="7%"><font style="font-size: 10pt;">.ml</font></td>
<td width="15%"><font style="font-size: 10pt;">马里</font></td>
<td width="6%"><font style="font-size: 10pt;">.sd</font></td>
<td width="17%"><font style="font-size: 10pt;">苏丹</font></td>
<td width="6%"><font style="font-size: 10pt;">.ws</font></td>
<td width="9%"><font style="font-size: 10pt;">西萨摩亚</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.ck</font></td>
<td width="13%"><font style="font-size: 10pt;">库克群岛</font></td>
<td width="7%"><font style="font-size: 10pt;">.gy</font></td>
<td width="14%"><font style="font-size: 10pt;">圭亚那</font></td>
<td width="7%"><font style="font-size: 10pt;">.mm</font></td>
<td width="15%"><font style="font-size: 10pt;">缅甸</font></td>
<td width="6%"><font style="font-size: 10pt;">.se</font></td>
<td width="17%"><font style="font-size: 10pt;">瑞典</font></td>
<td width="6%"><font style="font-size: 10pt;">.ye</font></td>
<td width="9%"><font style="font-size: 10pt;">也门</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cl</font></td>
<td width="13%"><font style="font-size: 10pt;">智利</font></td>
<td width="7%"><font style="font-size: 10pt;">.hk</font></td>
<td width="14%"><font style="font-size: 10pt;">香港</font></td>
<td width="7%"><font style="font-size: 10pt;">.mn</font></td>
<td width="15%"><font style="font-size: 10pt;">蒙古</font></td>
<td width="6%"><font style="font-size: 10pt;">.sg</font></td>
<td width="17%"><font style="font-size: 10pt;">新加坡</font></td>
<td width="6%"><font style="font-size: 10pt;">.yt</font></td>
<td width="9%"><font style="font-size: 10pt;">马约特岛</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cm</font></td>
<td width="13%"><font style="font-size: 10pt;">喀麦隆</font></td>
<td width="7%"><font style="font-size: 10pt;">.hn</font></td>
<td width="14%"><font style="font-size: 10pt;">洪都拉斯</font></td>
<td width="7%"><font style="font-size: 10pt;">.mo</font></td>
<td width="15%"><font style="font-size: 10pt;">澳门</font></td>
<td width="6%"><font style="font-size: 10pt;">.sh</font></td>
<td width="17%"><font style="font-size: 10pt;">圣赫勒拿岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.yu</font></td>
<td width="9%"><font style="font-size: 10pt;">南斯拉夫</font></td>
</tr>
<tr>
<td width="6%"><font style="font-size: 10pt;">.cn</font></td>
<td width="13%"><font style="font-size: 10pt;">中国</font></td>
<td width="7%"><font style="font-size: 10pt;">.hr</font></td>
<td width="14%"><font style="font-size: 10pt;">克罗地亚</font></td>
<td width="7%"><font style="font-size: 10pt;">.mp</font></td>
<td width="15%"><font style="font-size: 10pt;">北马里亚纳群岛</font></td>
<td width="6%"><font style="font-size: 10pt;">.si</font></td>
<td width="17%"><font style="font-size: 10pt;">斯洛文尼亚</font></td>
<td width="6%"><font style="font-size: 10pt;">.zm</font></td>
<td width="9%"><font style="font-size: 10pt;">赞比亚</font></td>
</tr>
<tr>
<td width="6%">.co</td>
<td width="13%">哥伦比亚</td>
<td width="7%">.ht</td>
<td width="14%">海地</td>
<td width="7%">.mq</td>
<td width="15%">马提尼克岛</td>
<td width="6%">.sj</td>
<td width="17%">斯瓦尔巴特/扬马延岛</td>
<td width="6%">.zr</td>
<td width="9%">扎伊尔</td>
</tr>
<tr>
<td width="6%">.cr</td>
<td width="13%">哥斯达黎加</td>
<td width="7%">.hu</td>
<td width="14%">匈牙利</td>
<td width="7%">.ms</td>
<td width="15%">蒙特塞拉特岛</td>
<td width="6%">.sk</td>
<td width="17%">斯洛伐克</td>
<td width="6%"></td>
<td width="9%"></td>
</tr>
<tr>
<td width="6%">.cs</td>
<td width="13%">捷克斯洛伐克</td>
<td width="7%">.id</td>
<td width="14%">印尼</td>
<td width="7%">.mt</td>
<td width="15%">马耳他</td>
<td width="6%">.sl</td>
<td width="17%">塞拉利昂</td>
</tr>
</tbody>
</table>
<p><strong>来源</strong>：<a target="_blank" href="http://www.domain.cn/club/viewthread.php?tid=437488&amp;amp;extra=page%3D1">http://www.domain.cn/club/viewthread.php?tid=437488&amp;amp;extra=page%3D1</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2011/06/27748.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google如何检测无效点击（转）</title>
		<link>http://blog.so8848.com/2011/05/2188.html</link>
		<comments>http://blog.so8848.com/2011/05/2188.html#comments</comments>
		<pubDate>Tue, 10 May 2011 02:27:26 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[adsense]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[作弊]]></category>
		<category><![CDATA[无效链接]]></category>

		<guid isPermaLink="false">http://jeffye.yo2.cn/articles/google%e5%a6%82%e4%bd%95%e6%a3%80%e6%b5%8b%e6%97%a0%e6%95%88%e7%82%b9%e5%87%bb%ef%bc%88%e8%bd%ac%ef%bc%89.html</guid>
		<description><![CDATA[Google如何检测无效点击（转） 2008-01-07  c10088bc http://www.ilmay.cn/post/ways-that-google-detects-invalid-clicks.html 我们经常听说 Google 有一套诡异的机制来检测无效点击，用来对付作弊者，但 Google 到底是怎么做到的呢？这篇文章归纳出 Google 用之以判断广告点击有效与否的方法。通常来说，Google 不会马上封掉你的帐户，他们会把你的帐户标记起来并进行特别监视，有时候还会给你寄警告信。 1. IP地址 任何人都不得不承认这个简单直接的方法。如果点击广告的人跟登录你 AdSense 帐户的人有着相同 IP，你的帐户就会被监视。 2. 点击率（CTR） 通常，一个网站的广告点击率不应该超过10%，否则 Google 会开始监视你的帐户。正常的点击率（仅供参考）应该在0.5%-10%之间。 3. 物理地址 Google 有很好的追踪技术，他们能把流量的来源追踪至不起眼的小镇，使用不同IP的两台电脑并不保证你能作弊成功。所以别尝试在网吧点击你的广告。 4. Cookies 很多家庭用户都不是固定IP上网的，通常你只需断网重连，就能获得一个新IP。但别忘记，Google 也在你的电脑里放了小曲奇饼。凭着 cookies，Google 就能知道点击来源于同一台电脑。 5. 点击方案 1. 如果有人打开你的网页然后马上点击广告，那就会受到怀疑了。通常人们都会在你的页面上看一会儿，再选择性的点击广告。 2. 如果有人从来只点击你网站上的广告，而从不点击别的网站上的 AdSense，呵呵。。。 3. 如果某个直接访问（如通过输入URL或从收藏夹打开）的访客，比起其它（如通过搜索引擎或其它网站登陆）访客，要更勤于点击广告。。。 6. 其它Google服务 除了 AdSense，Google 也给我们提供一系列的其它服务。别以为你不登陆自己的 AdSense 帐户人家就不知道你点击自己的广告哦。（其实这一点我觉得在账户关联的判断中使用的更多） 7. 搜索引擎排名 如果你的网站没有被任何搜索引擎收录，也没有权威的反向链接，你哪里得来如此高的流量？ 8. 鼓励点击 Google <a href='http://blog.so8848.com/2011/05/2188.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>Google如何检测无效点击（转）<br />
<span class="postdt"><font size="2">2008-01-07  c10088bc</font></span></p>
<dd class="post-body last">
<p class="content-wrapper">http://www.ilmay.cn/post/ways-that-google-detects-invalid-clicks.html</p>
<p>我们经常听说 <a target="_blank" href="http://www.ilmay.cn/catalog.asp?tags=google"><font color="#247cd4">Google</font></a> 有一套诡异的机制来检测无效点击，用来对付作弊者，但 Google 到底是怎么做到的呢？这篇文章归纳出 Google 用之以判断广告点击有效与否的方法。通常来说，Google 不会马上封掉你的帐户，他们会把你的帐户标记起来并进行特别监视，有时候还会给你寄警告信。</p>
<p><strong>1. IP地址</strong></p>
<p>任何人都不得不承认这个简单直接的方法。如果点击广告的人跟登录你 AdSense 帐户的人有着相同 IP，你的帐户就会被监视。</p>
<p><strong>2. 点击率（CTR）</strong></p>
<p>通常，一个网站的广告点击率不应该超过10%，否则 Google 会开始监视你的帐户。正常的点击率（仅供参考）应该在0.5%-10%之间。</p>
<p><strong>3. 物理地址</strong></p>
<p>Google 有很好的追踪技术，他们能把流量的来源追踪至不起眼的小镇，使用不同IP的两台电脑并不保证你能作弊成功。所以别尝试在网吧点击你的广告。</p>
<p><strong>4. Cookies</strong></p>
<p>很多家庭用户都不是固定IP上网的，通常你只需断网重连，就能获得一个新IP。但别忘记，Google 也在你的电脑里放了小曲奇饼。凭着 cookies，Google 就能知道点击来源于同一台电脑。</p>
<p><strong>5. 点击方案</strong></p>
<p>1. 如果有人打开你的网页然后马上点击广告，那就会受到怀疑了。通常人们都会在你的页面上看一会儿，再选择性的点击广告。<br />
2. 如果有人从来只点击你网站上的广告，而从不点击别的网站上的 AdSense，呵呵。。。<br />
3. 如果某个直接访问（如通过输入URL或从收藏夹打开）的访客，比起其它（如通过搜索引擎或其它网站登陆）访客，要更勤于点击广告。。。</p>
<p><strong>6. 其它Google服务</strong></p>
<p>除了 AdSense，Google 也给我们提供一系列的其它服务。别以为你不登陆自己的 AdSense 帐户人家就不知道你点击自己的广告哦。<em>（其实这一点我觉得在账户关联的判断中使用的更多）<br />
</em><strong>7. 搜索引擎排名</strong></p>
<p>如果你的网站没有被任何搜索引擎收录，也没有权威的反向链接，你哪里得来如此高的流量？</p>
<p><strong>8. 鼓励点击</strong></p>
<p>Google 的服务条款是明令禁止鼓励点击的。不要在网站上加上任何&#8221;请点击此广告&#8221;的字眼，别以为用图片来鼓励就没事，人家 Google 会有人时不时来你的网站看看。</p>
<p><strong>9. 转化率</strong></p>
<p>点击率是一回事，但如果转化率（点击用户转化为广告发布商店有效客户）过低，首先是你网站的定价会降低，然后。。帐户会被封掉<em>（这个有点严重了，我想 Google 应该不会因为这个封掉帐户的，因为单凭这一点，并没有违背 AdSense 的计划政策）</em></p>
<p><a target="_blank" href="http://www.alimama.com/membersvc/rd.do?w=p_10224917&amp;p=&amp;f=http://www.alimama.com/membersvc/promotion/tjyj.htm"><img border="0" src="http://img.alimama.cn/images/adzone/banner_tjyj_468x60.gif" alt="Image" /></a></p>
</dd>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2011/05/2188.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google Talk中英文翻译机器人试用</title>
		<link>http://blog.so8848.com/2011/05/2117.html</link>
		<comments>http://blog.so8848.com/2011/05/2117.html#comments</comments>
		<pubDate>Fri, 06 May 2011 14:28:45 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[gtalk]]></category>
		<category><![CDATA[机器人]]></category>

		<guid isPermaLink="false">http://jeffye.yo2.cn/articles/google-talk%e4%b8%ad%e8%8b%b1%e6%96%87%e7%bf%bb%e8%af%91%e6%9c%ba%e5%99%a8%e4%ba%ba%e8%af%95%e7%94%a8.html</guid>
		<description><![CDATA[]]></description>
			<content:encoded><![CDATA[<p><!--DATA[　今天试用了两个Google推出的中英文翻译机器人，分别是英译中en2zh@bot.talk.google.com和中译英的zh2en@bot.talk.google.com，使用<a target="_blank" href="http://www.williamlong.info/?tags=Gtalk" mce_href="http://www.williamlong.info/?tags=Gtal-->今天试用了两个Google推出的中英文翻译机器人，分别是英译中en2zh@bot.talk.google.com和中译英的zh2en@bot.talk.google.com，使用Gtalk加入这两个机器人后，和其对话即可进行文字翻译。感觉不错，分享之，希望以后能推出更多更实用的机器人产品。有能力的朋友也可以自己开发些好的机器人跟大家分享分享！</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2011/05/2117.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Top Sites in China</title>
		<link>http://blog.so8848.com/2010/03/55625.html</link>
		<comments>http://blog.so8848.com/2010/03/55625.html#comments</comments>
		<pubDate>Sat, 06 Mar 2010 07:38:35 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[internet]]></category>
		<category><![CDATA[Search Engine]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/?p=55625</guid>
		<description><![CDATA[1 baidu.com Music search engine and free MP3 &#38; video streaming for all kind o&#8230; More 2 qq.com 中国最大的门户网站，提供即时通讯、新闻资讯、网络游戏以及在线拍卖业务，&#8230; More 3 sina.com.cn 包括即日的国内外不同类型的新闻与评论，人物专题，图库。&#8230; More 4  google.cn 网页、图片、新闻搜索，支持个性化搜索及本地搜索，提供论坛、邮箱、日历服务和桌面搜索工具。&#8230; More 5  taobao.com 包括电脑通讯、数码、男装、女装、童装、化妆品、书籍音像、运动用品、游戏装备等各种商品的买卖，还有相关的社区交流，同时提供支付宝网上&#8230; More 6  google.com Enables users to search the Web, Usenet, and images. Features inc&#8230; More 7 163.com 提供以@yeah.net为后缀的的免费邮箱，容量3G。 8 sohu.com 资源导航为主要业务的门户网站，经营综合性业务，社区，无线等增值服务。&#8230; More 9  soso.com 提供论坛、网页、图片、音乐等类型搜索服务。 10 youku.com 优酷网（www.youku.com）是中国第一视频网站。优酷网立足为全球华人提供最快速的视频播放、最快速的视频发布、最快速的视频搜&#8230; More 11 kaixin001.com 是所有在职人士休闲的好去处，一个SNS的社区 12 tianya.cn 天涯社区作为中文网络社区之王，它的感性、丰富性和社会议题设置能力令人惊叹。这里自发生成了最多的草根明星、最具时代气息的天涯剧和最直&#8230; More 13 tudou.com 每个人都是生活的导演。 14  renren.com 人人网是一个真实的社交网络，联络你和你周围的朋友，和朋友分享相片、音乐、电影和游戏；找到老同学，结识新朋友。&#8230; More <a href='http://blog.so8848.com/2010/03/55625.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<li>
<div>1 <strong><a href="/siteinfo/baidu.com">baidu.com</a></strong></div>
<div>
<div>Music search engine and free MP3 &amp; video streaming for all kind o&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>2 <strong><a href="/siteinfo/qq.com">qq.com</a></strong></div>
<div>
<div>中国最大的门户网站，提供即时通讯、新闻资讯、网络游戏以及在线拍卖业务，&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>3 <strong><a href="/siteinfo/sina.com.cn">sina.com.cn</a></strong></div>
<div>
<div>包括即日的国内外不同类型的新闻与评论，人物专题，图库。&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>4  <strong><a href="/siteinfo/google.cn">google.cn</a></strong></div>
<div>
<div>网页、图片、新闻搜索，支持个性化搜索及本地搜索，提供论坛、邮箱、日历服务和桌面搜索工具。&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>5  <strong><a href="/siteinfo/taobao.com">taobao.com</a></strong></div>
<div>
<div>包括电脑通讯、数码、男装、女装、童装、化妆品、书籍音像、运动用品、游戏装备等各种商品的买卖，还有相关的社区交流，同时提供支付宝网上&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>6  <strong><a href="/siteinfo/google.com">google.com</a></strong></div>
<div>
<div>Enables users to search the Web, Usenet, and images. Features inc&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>7 <strong><a href="/siteinfo/163.com">163.com</a></strong></div>
<div>
<div>提供以@yeah.net为后缀的的免费邮箱，容量3G。</div>
</div>
</li>
<li>
<div>8 <strong><a href="/siteinfo/sohu.com">sohu.com</a></strong></div>
<div>
<div>资源导航为主要业务的门户网站，经营综合性业务，社区，无线等增值服务。&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>9  <strong><a href="/siteinfo/soso.com">soso.com</a></strong></div>
<div>
<div>提供论坛、网页、图片、音乐等类型搜索服务。</div>
</div>
</li>
<li>
<div>10 <strong><a href="/siteinfo/youku.com">youku.com</a></strong></div>
<div>
<div>优酷网（www.youku.com）是中国第一视频网站。优酷网立足为全球华人提供最快速的视频播放、最快速的视频发布、最快速的视频搜&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>11 <strong><a href="/siteinfo/kaixin001.com">kaixin001.com</a></strong></div>
<div>
<div>是所有在职人士休闲的好去处，一个SNS的社区</div>
</div>
</li>
<li>
<div>12 <strong><a href="/siteinfo/tianya.cn">tianya.cn</a></strong></div>
<div>
<div>天涯社区作为中文网络社区之王，它的感性、丰富性和社会议题设置能力令人惊叹。这里自发生成了最多的草根明星、最具时代气息的天涯剧和最直&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>13 <strong><a href="/siteinfo/tudou.com">tudou.com</a></strong></div>
<div>
<div>每个人都是生活的导演。</div>
</div>
</li>
<li>
<div>14  <strong><a href="/siteinfo/renren.com">renren.com</a></strong></div>
<div>
<div>人人网是一个真实的社交网络，联络你和你周围的朋友，和朋友分享相片、音乐、电影和游戏；找到老同学，结识新朋友。&#8230; <a>More</a></div>
</div>
</li>
<li>
<div>15 <strong><a href="/siteinfo/yahoo.com">yahoo.com</a></strong></div>
<div>
<div>Personalized content and search options. Chatrooms, free e-mail, &#8230; <a>More</a></div>
</div>
</li>
<li>
<div>16  <strong><a href="/siteinfo/ifeng.com">ifeng.com</a></strong></div>
<div>
<div>与资讯同步，使全球华人零距离</div>
</div>
</li>
<li>
<div>17 <strong><a href="/siteinfo/xunlei.com">xunlei.com</a></strong></div>
</li>
<li>
<div>18 <strong><a href="/siteinfo/hao123.com">hao123.com</a></strong></div>
</li>
<li>
<div>19  <strong><a href="/siteinfo/live.com">live.com</a> <span style="font-weight: normal;">Search engine from Microsoft.</span></strong></div>
</li>
<li>
<div>20  <strong><a href="/siteinfo/cnzz.com">cnzz.com</a></strong></div>
<div>
<div>CNZZ网站流量统计以互联网数据业务为主要方向，致力于为广大站长提供最为稳定、安全、先进、可靠的专业流量统计系统与数据服务&#8230; <a>More</a></div>
<div>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;</div>
<div>以上数据来自Alexa, 虽然这个统计一直存在很多argument, 但还是一定程度可做参考。</div>
<div><strong>Thoughts: </strong></div>
<div>1. Top 20 中，搜索引擎有baidu, google, 谷歌, soso四家之多。总体上来说，搜索已经成为网络生活必不可少工具，获取信息我们已经离不开搜索引擎。</div>
<div>2. Google上榜，感觉有点小意外，但还是蛮开心欣慰的。 因为Google 的用户大多应该是非娱乐的， 研究型，拒绝河蟹型，对外交流型。稳居第6，让人看到的事生机勃勃。</div>
<div>3. qq 连实力最弱的soso 也上榜，真实佩服小马哥的qq攻势，门户力压sina，到soso慢慢壮大，无不说明用户资源是块金矿。</div>
<div>最近试用了腾讯的邮箱和reader，感觉有一家公司能做中国google，腾讯也！163怎么轻易让庞大的邮箱用户流失，为啥就盘不活呢？</div>
<div>4.  如今四大门户都上榜，还有ifeng ，新闻资讯谁又能离得开？</div>
<div></div>
<div>5. hao123 反应的是与搜索相对的另一种需求 &#8212; 有时候我们有一些的信息需求，但是非常模糊，需要像hao123这样网站级navigator. 正如我们看新闻去163浏览，而不能用 google 直接搜索</div>
<div></div>
<div>6. kaixin， 人人  更多反应的entertainment 和 social 的需求</div>
<div>7. <a href="/siteinfo/cnzz.com">cnzz</a> 不知道何以流量这么多，除了站长谁会没事上cnzz，难道这就是传说中的刷 Alexa 排名！？</div>
</div>
</li>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2010/03/55625.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>The internet at sort-of-40. How did we get here?</title>
		<link>http://blog.so8848.com/2009/08/53962.html</link>
		<comments>http://blog.so8848.com/2009/08/53962.html#comments</comments>
		<pubDate>Wed, 12 Aug 2009 14:52:20 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>
		<category><![CDATA[history]]></category>
		<category><![CDATA[internet]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/?p=53962</guid>
		<description><![CDATA[The internet at sort-of-40. How did we get here? We&#8217;re looking to compile a history of the internet, by the internet. Want to help? Buzz up! Digg it (4) Simon Jeffery guardian.co.uk, Tuesday 11 August 2009 00.00 BST Article history Photograph: Microzoa/Getty Images The internet is sort-of-40 this year. Not in the sense of aHollywood actor <a href='http://blog.so8848.com/2009/08/53962.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<div id="article-header">
<div id="main-article-info">
<h1>The internet at sort-of-40. How did we get here?</h1>
<p id="stand-first" class="stand-first-alone">We&#8217;re looking to compile a history of the internet, by the internet. Want to help?</p>
</div>
<ul id="content-actions">
<li class="third-party-tool  no-comments "><a id="buzzlink" href="http://buzz.yahoo.com/buzz?publisherurn=the_guardian665&amp;targetUrl=http://www.guardian.co.uk/technology/2009/aug/11/internet-computing&amp;summary=%3Cp%3EWe%27re+looking+to+compile+a+history+of+the+internet%2C+by+the+internet.+Want+to+help%3F%3C%2Fp%3E&amp;headline=			The internet at sort-of-40. How did we get here? | 				Technology | 				guardian.co.uk 	">Buzz up!</a></li>
<li class="third-party-tool"><a id="digglink" href="http://digg.com/tech_news/The_internet_at_sort_of_40_How_did_we_get_here">Digg it (4)</a></li>
</ul>
</div>
<div id="content">
<ul class="article-attributes">
<li><a href="http://www.guardian.co.uk/profile/simonjeffery"><img class="contributor-pic-small" title="Contributor picture" src="http://static.guim.co.uk/sys-images/Guardian/Pix/pictures/2007/11/13/simon_jeffery_140x140.jpg" alt="Simon Jeffery" width="60" height="60" /></a></li>
<li id="contrib-shift">
<ul>
<li class="byline"><a name="&amp;lid={contentTypeByline}{Simon Jeffery}&amp;lpos={contentTypeByline}{1}" href="http://www.guardian.co.uk/profile/simonjeffery">Simon Jeffery</a></li>
<li class="publication"><a name="&amp;lid={contentTypeByline}{guardian.co.uk}&amp;lpos={contentTypeByline}{2}" href="http://www.guardian.co.uk/">guardian.co.uk</a>,	 Tuesday 11 August 2009 00.00 BST</li>
<li class="history"><a id="historylink-byline" class="rollover historylink" href="#history-byline">Article history</a></li>
</ul>
</li>
</ul>
<div id="article-wrapper">
<div class="image"><img src="http://static.guim.co.uk/sys-images/Guardian/About/General/2009/8/11/1249985916829/Man-holding-up-laptop-dis-002.jpg" alt="Man holding up laptop displaying smiley face" width="460" height="276" /></p>
<p class="caption">Photograph: Microzoa/Getty Images</p>
</div>
<p>The <a href="http://www.guardian.co.uk/technology/internet">internet</a> is sort-of-40 this year. Not in the sense of a<a href="http://www.guardian.co.uk/lifeandstyle/2009/aug/11/amanda-redman-age-celebrity">Hollywood actor who is in reality much older</a> but prefers to act vague, however. In the sense that if you set the October 1969 networking of US research universities through <a href="http://en.wikipedia.org/wiki/ARPANET">Arpanet</a> as the start point then it is a significant birthday.</p>
<p>To mark this, we want to tell the internet&#8217;s story. This is not the first time this has been done and will not be the last, but we want to tell the story of the internet using the internet – that is, the people who use it.</p>
<p>Below there is a list of 30 events from the past 40 years – encompassing the technological development of the internet and some of the impact it has had on culture, business, politics and society. Some of that makes for entertaining reading – <a href="http://www.templetons.com/brad/spamreact.html">reaction to the first piece of spam</a> (a US army major gets involved) or the <a href="http://www.nerdtimes.com/emoticons/">1982 conversation</a> that led to the first use of the <img src='http://blog.so8848.com/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' />  emoticon.</p>
<p>But these 30 events are not the only ones that mattered. There is no YouTube on here, nothing of Barack Obama&#8217;s use of the web for fundraising – and that is intentional. We&#8217;d like to know what you think is significant.</p>
<p>At the bottom of this page is a <a href="#form">form</a> where we would like you to nominate events memorable to you, be they ones we may already know about or something more personal such as the first websites you used or emails you sent. Our list is, for example, light on social media moments or internet dating. Or the thrill of a first <a href="http://mashable.com/2009/04/23/geocities-shutdown/">Geocities</a> site.</p>
<p>Maybe you did some of this pioneering work in the early days of the internet and want to talk about it. <a href="#form">Whatever your experiences, we&#8217;d like to hear from you</a>.</p>
<p>Where will it end? Well, this is a work in progress. But we will publish updates to the list and this autumn hope to produce an impressive told-by-the people version of the internet story</p>
<p>And here is the list of 30 &#8230;</p>
<div class="embed block">
<table class="in-article sortable" border="0" cellspacing="0" cellpadding="0">
<thead></thead>
<tbody>
<tr>
<td id="table-cell-2254-0-0" class="left">1969</td>
<td id="table-cell-2254-0-1" class="left">Arpanet starts</td>
<td id="table-cell-2254-0-2" class="last left">Computers at two academic departments in California are linked by Arpanet, the predecessor of the internet</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-1-0" class="left">1971</td>
<td id="table-cell-2254-1-1" class="left">@</td>
<td id="table-cell-2254-1-2" class="last left">Ray Tomlinson devises <a href="http://openmap.bbn.com/~tomlinso/ray/firstemailframe.html">electronic mail for arpanet</a>. He settles on @ to separate the name of the user from the name of their computer</td>
</tr>
<tr>
<td id="table-cell-2254-2-0" class="left">1971</td>
<td id="table-cell-2254-2-1" class="left">Project Gutenberg</td>
<td id="table-cell-2254-2-2" class="last left">Michael Hart begins a project to make copyright-free works electronically available. The first text is the US Declaration of Independence, now archived as <a href="http://bit.ly/1zIZZR">gutenberg.org/etext/1</a></td>
</tr>
<tr class="odd">
<td id="table-cell-2254-3-0" class="left">1971</td>
<td id="table-cell-2254-3-1" class="left">Expansion</td>
<td id="table-cell-2254-3-2" class="last left">The network is now connecting 23 hosts</td>
</tr>
<tr>
<td id="table-cell-2254-4-0" class="left">1973</td>
<td id="table-cell-2254-4-1" class="left"><a href="http://www.faqs.org/rfcs/rfc527.html">ARPAWOCKY</a></td>
<td id="table-cell-2254-4-2" class="last left">Early network humour: Twas brillig, and the Protocols / Did USER-SERVER in the wabe./ All mimsey was the FTP, / And the RJE outgrabe</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-5-0" class="left">1973</td>
<td id="table-cell-2254-5-1" class="left">To Europe</td>
<td id="table-cell-2254-5-2" class="last left">Norway is connected to Arpanet via Norsar, a US-Norwegian network to relay information on earthquakes and nuclear explosions. From Norway, a connection goes to University College London</td>
</tr>
<tr>
<td id="table-cell-2254-6-0" class="left">1974</td>
<td id="table-cell-2254-6-1" class="left">TCP/IP</td>
<td id="table-cell-2254-6-2" class="last left">Vint Cerf and others publish a <a href="http://tools.ietf.org/html/rfc675">proposal</a> to link up Arpa-like networks. It has no central control and is built around a protocol (TCP/IP) for the exchange of data</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-7-0" class="left">1976</td>
<td id="table-cell-2254-7-1" class="left">Royal email</td>
<td id="table-cell-2254-7-2" class="last left">Queen Elizabeth sends her first email on a visit to the MoD’s scientific research hub</td>
</tr>
<tr>
<td id="table-cell-2254-8-0" class="left">1978</td>
<td id="table-cell-2254-8-1" class="left">Spam</td>
<td id="table-cell-2254-8-2" class="last left">Gary Thuerk sends what is now considered the<a href="http://www.templetons.com/brad/spamreact.html">first unsolicited commercial email</a>. Major Raymond Czahor of the US defence communications agency assures Arpanet users it will not happen again</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-9-0" class="left">1978</td>
<td id="table-cell-2254-9-1" class="left">Bulletin boards</td>
<td id="table-cell-2254-9-2" class="last left">The first bulletin board is developed during a particularly bad blizzard in Chicago. Ward Christensen&#8217;s creation allows computer users with a modem to talk to each other and exchange software and data</td>
</tr>
<tr>
<td id="table-cell-2254-10-0" class="left">1982</td>
<td id="table-cell-2254-10-1" class="left"> <img src='http://blog.so8848.com/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </td>
<td id="table-cell-2254-10-2" class="last left">Scott Fahlman proposes the use of <a href="http://www.nerdtimes.com/emoticons/"> <img src='http://blog.so8848.com/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </a> after a joke, beating off rivals including %, * and {#} &#8211; said to be &#8216;like two lips with teeth showing between them&#8217;</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-11-0" class="left">1983</td>
<td id="table-cell-2254-11-1" class="left">Internet begins?</td>
<td id="table-cell-2254-11-2" class="last left">1 January is the cut-off point for computers to use Cerf&#8217;s transmission control protocol (TCP). Cerf estimates this involved between 200-400 hosts</td>
</tr>
<tr>
<td id="table-cell-2254-12-0" class="left">1984</td>
<td id="table-cell-2254-12-1" class="left">Lots more connections</td>
<td id="table-cell-2254-12-2" class="last left">The number of hosts breaks 1,000, Japan establishes Junet, the UK begins Janet (the joint academic network) and the Soviet Union connects to Usenet.</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-13-0" class="left">1984</td>
<td id="table-cell-2254-13-1" class="left">The Well</td>
<td id="table-cell-2254-13-2" class="last left">It calls itself &#8216;the primordial ooze where the online community movement was born&#8217;. A <a href="http://www.guardian.co.uk/Archive/Article/0,4273,4233515,00.html">Guardian profile</a> of The Well&#8217;s co-founder Stewart Brand said it was &#8216;where most of the discoveries of cyberspace were first made&#8217;</td>
</tr>
<tr>
<td id="table-cell-2254-14-0" class="left">1985</td>
<td id="table-cell-2254-14-1" class="left">.com</td>
<td id="table-cell-2254-14-2" class="last left">The domain name that for many defines the web is created. The oldest .com registration still in existence belongs to Virginia-based <a href="http://symbolics.com/">Symbolics</a></td>
</tr>
<tr class="odd">
<td id="table-cell-2254-15-0" class="left">1989</td>
<td id="table-cell-2254-15-1" class="left">Start of the web</td>
<td id="table-cell-2254-15-2" class="last left">Tim Berners-Lee <a href="http://www.w3.org/History/1989/proposal.html">proposes to his bosses at Cern</a> a document retrieval system to run on the internet. His mechanism will use hypertext to make a file in one location appear as if it is in a window on another</td>
</tr>
<tr>
<td id="table-cell-2254-16-0" class="left">1990</td>
<td id="table-cell-2254-16-1" class="left">Archie</td>
<td id="table-cell-2254-16-2" class="last left">Considered the first internet search engine, Archie is created by Canadian university student Alan Emtage. It allows users to match queries against file names (not the content of those files, that was still to come)</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-17-0" class="left">1990</td>
<td id="table-cell-2254-17-1" class="left"><a href="http://www.livinginternet.com/i/ia_myths_toast.htm">Internet toaster</a></td>
<td id="table-cell-2254-17-2" class="last left">A toaster becomes the first remotely-operated machine connected to the internet. A single control &#8211; power on or power off &#8211; is used to control grilling. It still requires a human to insert the bread</td>
</tr>
<tr>
<td id="table-cell-2254-18-0" class="left">1991</td>
<td id="table-cell-2254-18-1" class="left">First web page published</td>
<td id="table-cell-2254-18-2" class="last left">The web goes public. Its <a href="http://www.w3.org/History/19921103-hypertext/hypertext/WWW/TheProject.html">first page</a> explains it is a &#8216;wide-area hypermedia information retrieval initiative&#8217;</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-19-0" class="left">1991</td>
<td id="table-cell-2254-19-1" class="left">Webcam coffee</td>
<td id="table-cell-2254-19-2" class="last left">A <a href="http://www.cl.cam.ac.uk/coffee/coffee.html">coffee pot in a Cambridge University computer lab</a> is the inspiration for the world&#8217;s first webcam. It allows people in other parts of the building to avoid pointless trips when it is empty</td>
</tr>
<tr>
<td id="table-cell-2254-20-0" class="left">1992</td>
<td id="table-cell-2254-20-1" class="left">L0pht</td>
<td id="table-cell-2254-20-2" class="last left">The Boston-based hacker collective is founded</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-21-0" class="left">1994</td>
<td id="table-cell-2254-21-1" class="left">Yahoo!</td>
<td id="table-cell-2254-21-2" class="last left">Jerry and David&#8217;s Guide to the World Wide Web is launched. In time it is renamed <a href="http://web.archive.org/web/19961017235908/http://www2.yahoo.com/">Yahoo!</a></td>
</tr>
<tr>
<td id="table-cell-2254-22-0" class="left">1995</td>
<td id="table-cell-2254-22-1" class="left">Amazon.com</td>
<td id="table-cell-2254-22-2" class="last left">The internet bookseller goes online. By the final quarter of 2001 it turns a profit &#8211; a little behind its plan for profitability within four to five years, but is still considered an exceptional dotcom performer</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-23-0" class="left">1996</td>
<td id="table-cell-2254-23-1" class="left">Proto-Google</td>
<td id="table-cell-2254-23-2" class="last left">Larry Page and Sergey Brin, PhD students at Stanford, begin work on <a href="http://web.archive.org/web/19971210065425/backrub.stanford.edu/backrub.html">BackRub</a>, a search engine that ranks websites according to the number of links to them. It is incorporated as<a href="http://en.wikipedia.org/wiki/File:Google1998.png">Google in 1998</a></td>
</tr>
<tr>
<td id="table-cell-2254-24-0" class="left">1999</td>
<td id="table-cell-2254-24-1" class="left">&#8216;Celestial jukebox&#8217;</td>
<td id="table-cell-2254-24-2" class="last left">Shaun Fanning&#8217;s Napster application launches. It allows users share music files on each others&#8217; computers</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-25-0" class="left">1999</td>
<td id="table-cell-2254-25-1" class="left">MI6 names leaked</td>
<td id="table-cell-2254-25-2" class="last left">The uncontrollable nature of the internet is brought to attention when the names of more than 100 <a href="http://www.guardian.co.uk/uk/1999/jun/08/davidpallister">MI6 agents</a> are leaked to a US website. Despite being taken down, the names spread across other sites</td>
</tr>
<tr>
<td id="table-cell-2254-26-0" class="left">2001</td>
<td id="table-cell-2254-26-1" class="left"><a href="http://www.wikipedia.org/">Wikipedia</a></td>
<td id="table-cell-2254-26-2" class="last left">It proclaims itself a collaborative encyclopedia. Eight years after launch it is now the most popular reference work online</td>
</tr>
<tr class="odd">
<td id="table-cell-2254-27-0" class="left">2001</td>
<td id="table-cell-2254-27-1" class="left"><a href="http://setiathome.ssl.berkeley.edu/">SETI@Home</a></td>
<td id="table-cell-2254-27-2" class="last left">A project to harness the distributed processing power of the internet gathers enough volunteers within four weeks to surpass the most powerful supercomputer of its time</td>
</tr>
<tr>
<td id="table-cell-2254-28-0" class="left">2004</td>
<td id="table-cell-2254-28-1" class="left">The war on spam</td>
<td id="table-cell-2254-28-2" class="last left">Bill Gates tells the World Economic Forum at Davos that spam will be erradicated within two years. <a href="http://www.guardian.co.uk/news/blog/2006/jan/25/thewaronspam">It isn&#8217;t</a></td>
</tr>
<tr class="odd">
<td id="table-cell-2254-29-0" class="left">2005</td>
<td id="table-cell-2254-29-1" class="left"><a href="http://news.bbc.co.uk/1/hi/technology/3981099.stm">First spam conviction</a></td>
<td id="table-cell-2254-29-2" class="last left">Jeremy Jaynes sentenced to nine years in prison and his sister, Jessica DeGroot, fined $7,500</td>
</tr>
<tr>
<td id="table-cell-2254-30-0" class="left">2006</td>
<td id="table-cell-2254-30-1" class="left">Twitter</td>
<td id="table-cell-2254-30-2" class="last left">The 140 character service launches. Many who initially try it think it pointless. By 2009 it is credited with transmitting news of Iranian protests to the outside world</td>
</tr>
</tbody>
</table>
</div>
<p>You may notice the launch of Twitter is the final item on this list. That is not to suggest that it is the <a href="http://www.guardian.co.uk/media/2009/apr/01/guardian-twitter-media-technology">final perfection of the internet</a> (just to be clear).</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2009/08/53962.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google accounts on Twitter</title>
		<link>http://blog.so8848.com/2009/07/53459.html</link>
		<comments>http://blog.so8848.com/2009/07/53459.html#comments</comments>
		<pubDate>Sun, 12 Jul 2009 19:40:27 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/2009/07/53459.html</guid>
		<description><![CDATA[&#160; &#160; Sent to you by Jeffye via Google Reader: &#160; &#160; Google accounts on Twitter via The Official Google Blog by A Googler on 7/11/09 Like lots of you, we&#8217;ve been drawn into Twitter this year. After all, we&#8217;re all about frequent updates ourselves, and there&#8217;s lots happening around here that we want to <a href='http://blog.so8848.com/2009/07/53459.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="padding: 4px; background-color: #c3d9ff;">
<h3>Sent to you by Jeffye via Google Reader:</h3>
</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="font-family:sans-serif;overflow:auto;width:100%;margin: 0px 10px">
<h2>
<div class=""><a href="http://feedproxy.google.com/~r/blogspot/MKuf/~3/NryvumBfEO0/google-accounts-on-twitter.html">Google accounts on Twitter</a></div>
</h2>
<div style="margin-bottom: 0.5em">via <a href="http://googleblog.blogspot.com/" class="f">The Official Google Blog</a> by A Googler on 7/11/09</div>
<p>
Like lots of you, we&#8217;ve been drawn into Twitter this year. After all, we&#8217;re all about frequent updates ourselves, and there&#8217;s lots happening around here that we want to share with you. Of course, we enjoy watching, and contributing to, the tweetstream (we hope you find our tweets useful, too). Because there are many programs and initiatives across the company, we&#8217;ve got a number of active accounts. Here&#8217;s a list of the current ones. We&#8217;ll update this list from time to time.</p>
<p><a href="http://twitter.com/google" title="twitter.com/google">twitter.com/Google</a> &#8211; our central account<br /><a href="http://twitter.com/blogger" title="twitter.com/blogger">twitter.com/Blogger</a> &#8211; for Blogger fans<br /><a href="http://twitter.com/googlecalendar" title="twitter.com/googlecalendar">twitter.com/GoogleCalendar</a> &#8211; user tips &amp; updates<br /><a href="http://twitter.com/googleimages" title="twitter.com/googleimages">twitter.com/GoogleImages</a> &#8211; news, tips, tricks on our visual image search<br /><a href="http://twitter.com/googlenews" title="twitter.com/googlenews">twitter.com/GoogleNews</a> &#8211; latest headlines via Google News<br /><a href="http://twitter.com/googlereader" title="twitter.com/googlereader">twitter.com/GoogleReader</a> &#8211; from our feed reader team<br /><a href="http://twitter.com/igoogle" title="twitter.com/igoogle">twitter.com/iGoogle</a> &#8211; news &amp; notes from Google&#39;s personalized homepage<br /><a href="http://twitter.com/googlestudents" title="twitter.com/googlestudents">twitter.com/GoogleStudents</a> &#8211; news of interest to students using Google<br /><a href="http://twitter.com/youtube" title="twitter.com/youtube">twitter.com/YouTube</a> &#8211; for YouTube fans<br /><a href="http://twitter.com/youtubees" title="twitter.com/youtubees">twitter.com/YouTubeES</a> &#8211; en Espanol<br /><a href="http://twitter.com/googleatwork" title="twitter.com/googleatwork">twitter.com/GoogleAtWork</a> &#8211; solutions for IT and workplace productivity</p>
<p><b>Geo-related</b><br /><a href="http://twitter.com/sketchup" title="twitter.com/sketchup">twitter.com/SketchUp</a> &#8211; Google SketchUp news<br /><a href="http://twitter.com/3DWH" title="twitter.com/3DWH">twitter.com/3DWH</a> &#8211; SketchUp&#8217;s 3D Warehouse<br /><a href="http://twitter.com/modelyourtown" title="twitter.com/modelyourtown">twitter.com/Modelyourtown</a> &#8211; 3D modeling to build your favorite places<br /><a href="http://twitter.com/earthoutreach" title="twitter.com/earthoutreach">twitter.com/EarthOutreach</a> &#8211; Earth &amp; Maps tools for nonprofits &amp; orgs<br /><a href="http://twitter.com/googlemaps" title="twitter.com/googlemaps">twitter.com/GoogleMaps</a> &#8211; uses, tips, mashups<br /><a href="http://twitter.com/googleskymap" title="twitter.com/googleskymap">twitter.com/GoogleSkyMap</a> -Android app for the night sky</p>
<p><b>Ads-related </b><br /><a href="http://twitter.com/adsense" title="twitter.com/adsense">twitter.com/AdSense</a> &#8211; for online publishers<br /><a href="http://twitter.com/adwordshelper" title="twitter.com/adwordshelper">twitter.com/AdWordsHelper</a> &#8211; looking out for AdWords questions and tech issues<br /><a href="http://twitter.com/adwordsprosarah" title="twitter.com/adwordsprosarah">twitter.com/AdWordsProSarah</a> &#8211; Google Guide for AdWords Help Forum<br /><a href="http://twitter.com/googleanalytics" title="twitter.com/googleanalytics">twitter.com/GoogleAnalytics</a> &#8211; insights for website effectiveness<br /><a href="http://twitter.com/googleadbuilder" title="twitter.com/googleadbuilder">twitter.com/GoogleAdBuilder</a> &#8211; re building display ads<br /><a href="http://twitter.com/googleretail" title="twitter.com/googleretail">twitter.com/GoogleRetail</a> &#8211; for retail advertisers<br /><a href="http://twitter.com/technologyuk" title="twitter.com/technologyUK">twitter.com/TechnologyUK</a> &#8211; for U.K. tech advertisers<br /><a href="http://twitter.com/insideadwordsde" title="twitter.com/insideadwordsde">twitter.com/InsideAdWordsDE</a> &#8211; for German AdWords customers<br /><a href="http://twitter.com/googleagencyde" title="twitter.com/googleagencyde">twitter.com/GoogleAgencyDE</a> &#8211; for German ad agencies<br /><a href="http://twitter.com/AdSensePT" title="twitter.com/AdSensePT">twitter.com/AdSensePT</a> &#8211; info for Portuguese-language publishers<br /><a href="http://twitter.com/AdWordsRussia" title="twitter.com/AdWordsRussi">twitter.com/AdWordsRussia</a> &#8211; AdWords news &amp; tips in Russian<br /><a href="http://twitter.com/dentrodeadwords" title="twitter.com/dentrodeadwords">twitter.com/DentroDeAdWords</a> &#8211; Spanish updates from the Inside AdWords blog<br /><a href="http://twitter.com/adwordsapi" title="twitter.com/adwordsapi">twitter.com/AdWordsAPI</a> &#8211; AdWords API tips</p>
<p><b>Developer &amp; technical </b><br /><a href="http://twitter.com/googleresearch" title="twitter.com/googleresearch">twitter.com/GoogleResearch</a> &#8211; from our research scientists<br /><a href="http://twitter.com/googlewmc" title="twitter.com/googlewmc">twitter.com/GoogleWMC</a> &#8211; Google Webmaster Central<br /><a href="http://twitter.com/googlecode" title="twitter.com/googlecode">twitter.com/GoogleCode</a> &#8211; latest updates for Google developer products<br /><a href="http://twitter.com/googledata" title="twitter.com/googledata">twitter.com/GoogleData</a> &#8211; Data APIs provide a standard protocol for reading and writing web data<br /><a href="http://twitter.com/app_engine" title="twitter.com/app_engine">twitter.com/app_engine</a> &#8211; web apps run on Google infrastructure<br /><a href="http://twitter.com/dataliberation" title="twitter.com/dataliberation">twitter.com/DataLiberation</a> &#8211; our initiative for complete import/export of all data<br /><a href="http://twitter.com/googlemapsapi" title="twitter.com/googlemapsapi">twitter.com/GoogleMapsAPI</a> &#8211; about using Google Maps embedded in websites<br /><a href="http://twitter.com/googleio" title="twitter.com/googleio">twitter.com/GoogleIO</a> &#8211; Google&#8217;s largest annual developer event</p>
<p><b>Culture, People </b><br /><a href="http://twitter.com/googletalks" title="twitter.com/googletalks">twitter.com/googletalks</a> &#8211; notes from our @Google speaker series<br /><a href="http://twitter.com/googlejobs" title="twitter.com/googlejobs">twitter.com/googlejobs</a> &#8211; the voice of Google recruiters</p>
<p><b>Country or Region </b><br /><a href="http://twitter.com/googlearabia">twitter.com/googlearabia</a> &#8211; news from the Google Arabia Blog*<br /><a href="http://twitter.com/googledownunder" title="twitter.com/googledownunder"></a>
<div><a href="http://twitter.com/googledownunder" title="twitter.com/googledownunder">twitter.com/googledownunder</a> &#8211; Google activities in Australia &amp; New Zealand<br /><a href="http://twitter.com/googlede" title="twitter.com/GoogleDE">twitter.com/GoogleDE</a> &#8211; Google in Germany<br /><a href="http://twitter.com/googlelatam" title="twitter.com/GoogleLatAm">twitter.com/GoogleLatAm</a> &#8211; Latin America (en Espanol)<br /><a href="http://twitter.com/googlepolicyit" title="twitter.com/GooglePolicyIt">twitter.com/GooglePolicyIt</a> &#8211; Notes on Google policy issues in Italy</p>
</div>
<div><b><i>Update:</i></b> Additions indicated by *<br />Posted by Karen Wickre, Google Blog &amp; Twitter Team</div>
<div><img width="1" height="1" src="https://blogger.googleusercontent.com/tracker/10861780-6953753501936345361?l=googleblog.blogspot.com"/></div>
<div>
<a href="http://feeds.feedburner.com/~ff/blogspot/MKuf?a=NryvumBfEO0:vShDSvCZVqA:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/blogspot/MKuf?d=yIl2AUoC8zA" border="0"/></a> <a href="http://feeds.feedburner.com/~ff/blogspot/MKuf?a=NryvumBfEO0:vShDSvCZVqA:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/blogspot/MKuf?i=NryvumBfEO0:vShDSvCZVqA:V_sGLiPBpWU" border="0"/></a>
</div>
<p><img src="http://feeds.feedburner.com/~r/blogspot/MKuf/~4/NryvumBfEO0" height="1" width="1"/></div>
<p></p>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="padding: 4px; background-color: #c3d9ff;">
<h3>Things you can do from here:</h3>
<ul style="font-family:sans-serif">
<li><a href="http://www.google.com/reader/view/feed%2Fhttp%3A%2F%2Fgoogleblog.blogspot.com%2Fatom.xml?source=email">Subscribe to The Official Google Blog</a> using <b>Google Reader</b></li>
<li><a href="http://www.google.com/reader/?source=email">Get started using Google Reader</a> to easily keep up with <b>all your favorite sites</b></li>
</ul>
</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2009/07/53459.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google最近有点烦……</title>
		<link>http://blog.so8848.com/2009/06/53098.html</link>
		<comments>http://blog.so8848.com/2009/06/53098.html#comments</comments>
		<pubDate>Sat, 27 Jun 2009 14:06:43 +0000</pubDate>
		<dc:creator>yezheng</dc:creator>
				<category><![CDATA[Web]]></category>

		<guid isPermaLink="false">http://blog.so8848.com/2009/06/53098.html</guid>
		<description><![CDATA[太有才了 &#160; &#160; Sent to you by Jeffye via Google Reader: &#160; &#160; Google&#26368;&#36817;&#26377;&#28857;&#28902;&#8230;&#8230; via Pure Pleasure &#8211; Reborn by &#26446;&#31505;&#26469; on 6/25/09 地球人都知道Google…… Google说它不作恶是它的DNA…… Google只是平台，内容是用户生成的…… 老大哥其实一直在盯着…… 其实，Google.cn早已经“嫣然”…… 可他们还是不想放过Google，哪怕它早已在漩涡之中…… 他们控诉Google涉黄…… 有人建议说，黄就黄吧，带套（tor）就行…… 其实早有侦探发现Google是被诬陷…… 一时间群魔乱舞…… 坊间传言说有一家公司特别高兴…… 突然有一天晚上Google不见啦，Google Book也没了…… 没一会儿Google就又回来了，可是人们还是非常害怕…… 难道有一天我们要用摩斯码看Google？ 还是我们要用布雷码？ 哦，想起来了，其实我们早就变成了青蛙，会翻墙…… 难道Google真的在沦陷？ 还是早晚只剩下尸骨残骸？ 马丁路德金有的我也有…… 到我老的时候还是能用Google…… 我们总是或者总会能看到我们想看到的…… &#160; &#160; Things you can do from here: Subscribe to <a href='http://blog.so8848.com/2009/06/53098.html'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>太有才了</p>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="padding: 4px; background-color: #c3d9ff;">
<h3>Sent to you by Jeffye via Google Reader:</h3>
</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="font-family:sans-serif;overflow:auto;width:100%;margin: 0px 10px">
<h2>
<div class=""><a href="http://www.xiaolai.net/index.php/archives/6905.html">Google&#26368;&#36817;&#26377;&#28857;&#28902;&hellip;&hellip;</a></div>
</h2>
<div style="margin-bottom: 0.5em">via <a href="http://www.xiaolai.net" class="f">Pure Pleasure &#8211; Reborn</a> by &#26446;&#31505;&#26469; on 6/25/09</div>
<p></p>
<p>地球人都知道Google……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-for-children.jpg" alt="Everyone knows google" width="350" height="224"/></p>
<p>Google说它不作恶是它的DNA……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-dna.gif" alt="google-logo-dna" width="276" height="110"/></p>
<p>Google只是平台，内容是用户生成的……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-self-drawing.gif" alt="google-logo-self-drawing" width="276" height="110"/></p>
<p>老大哥其实一直在盯着……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-watched.gif" alt="google-logo-watched" width="218" height="135"/></p>
<p>其实，Google.cn早已经“嫣然”……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-cn.gif" alt="google-logo-cn" width="276" height="120"/></p>
<p>可他们还是不想放过Google，哪怕它早已在漩涡之中……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-swirl.gif" alt="google-logo-swirl" width="413" height="138"/></p>
<p>他们控诉Google涉黄……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-porn.jpg" alt="google-logo-porn" width="267" height="107"/></p>
<p>有人建议说，黄就黄吧，带套（tor）就行……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-condom.jpg" alt="google-logo-condom" width="287" height="116"/></p>
<p>其实早有侦探发现Google是被诬陷……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-detective.gif" alt="google-logo-detective" width="276" height="132"/></p>
<p>一时间群魔乱舞……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-ghost.gif" alt="google-logo-ghost" width="276" height="125"/></p>
<p>坊间传言说有一家公司特别高兴……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-baidu-tread.GIF" alt="google-logo-baidu-tread" width="321" height="148"/></p>
<p>突然有一天晚上Google不见啦，Google Book也没了……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-book.gif" alt="google-logo-book" width="276" height="110"/></p>
<p>没一会儿Google就又回来了，可是人们还是非常害怕……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-scared.png" alt="google-logo-scared" width="320" height="123"/></p>
<p>难道有一天我们要用摩斯码看Google？</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-morse-code.gif" alt="google-logo-morse-code" width="300" height="110"/></p>
<p>还是我们要用布雷码？</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-braille.gif" alt="google-logo-braille" width="330" height="110"/></p>
<p>哦，想起来了，其实我们早就变成了青蛙，会翻墙……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-jump-over.gif" alt="google-logo-jump-over" width="321" height="132"/></p>
<p>难道Google真的在沦陷？</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-iceburg.gif" alt="google-logo-iceburg" width="330" height="125"/></p>
<p>还是早晚只剩下尸骨残骸？</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-fossil.gif" alt="google-logo-fossil" width="300" height="125"/></p>
<p>马丁路德金有的我也有……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-i-have-a-dream.gif" alt="google-logo-i-have-a-dream" width="276" height="110"/></p>
<p>到我老的时候还是能用Google……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-elders.gif" alt="google-logo-elders" width="276" height="125"/></p>
<p>我们总是或者总会能看到我们想看到的……</p>
<p><img src="http://www.xiaolai.net/wp-content/uploads/2009/06/google-logo-earthday.gif" alt="google-logo-earthday" width="353" height="126"/></p>
</div>
<p></p>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="padding: 4px; background-color: #c3d9ff;">
<h3>Things you can do from here:</h3>
<ul style="font-family:sans-serif">
<li><a href="http://www.google.com/reader/view/feed%2Fhttp%3A%2F%2Fwww.xiaolai.net%2Findex.php%2Ffeed?source=email">Subscribe to Pure Pleasure &#8211; Reborn</a> using <b>Google Reader</b></li>
<li><a href="http://www.google.com/reader/?source=email">Get started using Google Reader</a> to easily keep up with <b>all your favorite sites</b></li>
</ul>
</div>
<div style="margin: 0px 1px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
<div style="margin: 0px 2px; padding-top: 1px;    background-color: #c3d9ff; font-size: 1px !important;    line-height: 0px !important;">&nbsp;</div>
]]></content:encoded>
			<wfw:commentRss>http://blog.so8848.com/2009/06/53098.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

