(4)继续优化――用空间换取时间
现在对每一个字符,都要用get_Item(object key)方法过一遍,可这个乖乖方法那么长,肯定太耗时间了,能不能用更简单的手段呢?改Hashtable?哇,那代码,叫一个看不懂。仔细琢磨琢磨,有了,直接用数组!每一个汉字对应一个Int16,以该值为索引,数组中在那个位置的值为值,这样最快速了。就是占点空间,内存便宜嘛。反正这东西只初始化一次,占不了多少k。新程序如下:
1
public class QuickChineseConvert
2

{
3
static char[] _lib;
4
static int _size;
5
6
static QuickChineseConvert()
7
{
8
_size=UInt16.MaxValue;
9
Init();
10
}
11
static string GB_lib="……";
12
static string BIG5_lib="……";
13
14
private static void PushIntoArray(char[] c , string g, string b)
15
{
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 这样的话,对于每一个字符,只进行几个简单的操作了: Convert.ToUInt16(inputChar) 从数组中取值_lib[Convert.ToUInt16(inputChar)] 然后就是return temp==0?inputChar:(char)temp; 对比Hashtable臭长臭长的get_Item(object key),这下简单多了!当然,要付出一定代价,代价就是要弄一个大小为UInt16.MaxValue的数组,不大嘛。 测试性能,很鼓舞人心:1857万字/s (5)Go on........... 还能继续优化吗?数组不是还要检查边界条件吗?用指针?书上说能提高性能17%。17%少了点,不过也试一试。测试结果表明,性能没怎么提高。现在性能瓶颈在传值,return那一块,用ref,out什么的试一试? 做了以下类似的改动,这个性能又提了到差不多10倍。 1 2 3 4 5 1 2 3 4 5 6 7 测试结果:1.444亿字/s。10个指令周期一个字符!!应该不能再优化了吧!到此为止吧,这性能应该够用了. 不过这个结果有点伪,因为必须传入字符或字符数组。而String是只读的,使用过程必须复制一遍,用String做参数性能只到的了8000万字/s左右 (6)优化路径小结 简单的方法,Replace,30万字/s ------->采用更好的数据结构和算法(Hashtable),300万字/s ------->用reflector查看Hashtable代码,做进一步的优化,500万字/s ------->分析问题所在,直接采用数组,用空间换取时间,1850万字/s ------->采用ref,out等技巧做进一步优化,1.44亿字/s(传数组)8000万字/s(传string)
for (int i=0;i
{
c[Convert.ToUInt16(g[i])]=b[i];
}
}
private static void Init()
{
_lib = new char[_size];
PushIntoArray(_lib,GB_lib,BIG5_lib);
}
public static char ToBIG5(char inputChar)
{
char temp = _lib[Convert.ToUInt16(inputChar)];
return temp==0?inputChar:(char)temp;
}
public static string ToBIG5(string inputString)
{
StringBuilder sb = new StringBuilder();
for (int i=0;i
{
sb.Append(ToBIG5(inputString[i]));
}
return sb.ToString();
}
}
public static void ToBIG5(ref char inputChar)
{
char temp = LibGB2BIG5[Convert.ToUInt16(inputChar)];
if (temp!=0) inputChar=temp;
}
public static void ToBIG5(ref char[] inputString)
{
for (int i=0;i
{
inputString[i]=ToBIG5(inputString[i]);
}
}

