原文:http://dev.firnow.com/course/3_program/c++/cppjs/20090403/163954.html
LPTSTR、LPCSTR、LPCTSTR、LPSTR的來(lái)源及意義
UNICODE:它是用兩個(gè)字節(jié)表示一個(gè)字符的方法。比如字符'A'在ASCII下面是一個(gè)字符,可'A'在UNICODE下面是兩個(gè)字符,高字符用0填充,而且漢字'程'在ASCII下面是兩個(gè)字節(jié),而在UNICODE下仍舊是兩個(gè)字節(jié)
。UNICODE的用處就是定長(zhǎng)表示世界文字,據(jù)統(tǒng)計(jì),用兩個(gè)字節(jié)可以編碼現(xiàn)存的所有文字而沒(méi)有二義。
MBCS,它是多字節(jié)字符集,它是不定長(zhǎng)表示世界文字的編碼。MBCS表示英文字母時(shí)就和ASCII一樣(這也是我們?nèi)菀装?/span>MBCS和ASCII搞混的原因),但表示其他文字時(shí)就需要用多字節(jié)。
WINDOWS下面的程序設(shè)計(jì)可以支持MBCS和UNICODE兩種編碼的字符串,具體用那種就看你定義了MBCS宏還是UNICODE宏。MBCS宏對(duì)應(yīng)的字符串指針是char*也就是LPSTR,UNICODE對(duì)應(yīng)的指針是unsigned short*也就是LPWSTR,為了寫(xiě)程序方便微軟定義了類型LPTSTR,在MBCS下他就是char*, 在UNICODE下它是unsigned char*,這樣你就可以重定義一個(gè)宏進(jìn)行不同字符集的轉(zhuǎn)換了。
LPTSTR、LPCSTR、LPCTSTR、LPSTR的意義:
LPSTR:32bit指針 指向一個(gè)字符串,每個(gè)字符占1字節(jié)
LPCSTR:32-bit指針 指向一個(gè)常字符串,每個(gè)字符占1字節(jié)
LPCTSTR:32-bit指針 指向一個(gè)常字符串,每字符可能占1字節(jié)或2字節(jié),取決于Unicode是否定義
LPTSTR:32-bit指針 每字符可能占1字節(jié)或2字節(jié),取決于Unicode是否定義
Windows使用兩種字符集ANSI和UNICODE,前者就是通常使用的單字節(jié)方式,但這種方式處理象中文這樣的雙字節(jié)字符不方便,容易出現(xiàn)半個(gè)漢字的情況。而后者是雙字節(jié)方式,方便處理雙字節(jié)字符。
WindowsNT的所有與字符有關(guān)的函數(shù)都提供兩種方式的版本,而Windows9x只支持ANSI方式。_T一般同字常數(shù)相關(guān),如_T("Hello"。如果你編譯一個(gè)程序?yàn)?/span>ANSI方式,_T實(shí)際不起任何作用。而如果編譯一個(gè)程序?yàn)?/span>UNICODE方式,則編譯器會(huì)把"Hello"字符串以UNICODE方式保存。_T和_L的區(qū)別在于,_L不管你是以什么方式編譯,一律UNICODE方式保存.
Windows核心編程的第一章。
L是表示字符串資源為Unicode的。
比如
wchar_t Str[] = L"Hello World!";
這個(gè)就是雙子節(jié)存儲(chǔ)字符了。
_T是一個(gè)適配的宏~
當(dāng)
#ifdef _UNICODE的時(shí)候
_T就是L
沒(méi)有#ifdef _UNICODE的時(shí)候
_T就是ANSI的。
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上兩句使得無(wú)論是在UNICODE編譯條件下都是正確編譯的。
而且MS推薦你使用相匹配的字符串函數(shù)。
比如處理LPTSTR或者LPCTSTR 的時(shí)候,不要用strlen ,而是要用_tcslen
否則在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。
T是非常有意思的一個(gè)符號(hào)(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一種中間類型,既不明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪種字符集?編譯的時(shí)候才決定
在vc++中有著各種字符串的表示法,如您所說(shuō)。
首先char* 是指向ANSI字符數(shù)組的指針,其中每個(gè)字符占據(jù)8位(有效數(shù)據(jù)是除掉最高位的其他7位),這里保持了與傳統(tǒng)的C,C++的兼容。
LP的含義是長(zhǎng)指針(long pointer)。
LPSTR是一個(gè)指向以‘"0’結(jié)尾的ANSI字符數(shù)組的指針,與char*可以互換使用,在win32中較多地使用LPSTR。而LPCSTR中增加的‘C’的含義是“CONSTANT”(常量),表明這種數(shù)據(jù)類型的實(shí)例不能被使用它的API函數(shù)改變,除此之外,它與LPSTR是等同的。
為了滿足程序代碼國(guó)際化的需要,業(yè)界推出了Unicode標(biāo)準(zhǔn),它提供了一種簡(jiǎn)單和一致的表達(dá)字符串的方法,所有字符中的字節(jié)都是16位的值,其數(shù)量也可以滿足差不多世界上所有書(shū)面語(yǔ)言字符的編碼需求,開(kāi)發(fā)程序時(shí)使用Unicode(類型為wchar_t)是一種被鼓勵(lì)的做法。
LPWSTR與LPCWSTR由此產(chǎn)生,它們的含義類似于LPSTR與LPCSTR,只是字符數(shù)據(jù)是16位的wchar_t而不是char。
然后為了實(shí)現(xiàn)兩種編碼的通用,提出了TCHAR的定義:
如果定義_UNICODE,聲明如下: typedef wchar_t TCHAR;
如果沒(méi)有定義_UNICODE,則聲明如下: typedef char TCHAR;
LPTSTR和LPCTSTR中的含義就是每個(gè)字符是這樣的TCHAR。
CString類中的字符就是被聲明為TCHAR類型的,它提供了一個(gè)封裝好的類供用戶方便地使用。
如果您還需要進(jìn)一步的信息,請(qǐng)參看http://msdn.microsoft.com/library/default.asp?url=/library/en-us/vclib/html/_crt_data_type_mappings.asp等其他有關(guān)信息。
LPTSTR、LPCSTR、LPCTSTR、LPSTR之間的轉(zhuǎn)換:
如何理解LPCTSTR類型?
2007-11-10 21:43
L表示long指針
這是為了兼容Windows 3.1等16位操作系統(tǒng)遺留下來(lái)的,在win32中以及其他的32為操作系統(tǒng)中, long指針和near指針及far修飾符都是為了兼容的作用。沒(méi)有實(shí)際意義。
P表示這是一個(gè)指針
C表示是一個(gè)常量
T表示在Win32環(huán)境中,有一個(gè)_T宏
這個(gè)宏用來(lái)表示你的字符是否使用UNICODE, 如果你的程序定義了UNICODE或者其他相關(guān)的宏,那么這個(gè)字符或者字符串將被作為UNICODE字符串,否則就是標(biāo)準(zhǔn)的ANSI字符串。
STR表示這個(gè)變量是一個(gè)字符串
所以LPCTSTR就表示一個(gè)指向常固定地址的可以根據(jù)一些宏定義改變語(yǔ)義的字符串。
同樣, LPCSTR就只能是一個(gè)ANSI字符串,在程序中我們大部分時(shí)間要使用帶T的類型定義。
LPCTSTR == const TCHAR *
CString 和 LPCTSTR 可以說(shuō)通用。 原因在于CString定義的自動(dòng)類型轉(zhuǎn)換,沒(méi)什么奇特的,最簡(jiǎn)單的C++操作符重載而已。
常量字符串ansi和unicode的區(qū)分是由宏_T來(lái)決定的。但是用_T("abcd")時(shí), 字符串"abcd"就會(huì)根據(jù)編譯時(shí)的是否定一_UNICODE來(lái)決定是char* 還是 w_char*。 同樣,TCHAR 也是相同目的字符宏。 看看定義就明白了。簡(jiǎn)單起見(jiàn),下面只介紹 ansi 的情況,unicode 可以類推。
ansi情況下,LPCTSTR 就是 const char*, 是常量字符串(不能修改的)。
而LPTSTR 就是 char*, 即普通字符串(非常量,可修改的)。
這兩種都是基本類型, 而CString 是 C++類, 兼容這兩種基本類型是最起碼的任務(wù)了。
由于const char* 最簡(jiǎn)單(常量,不涉及內(nèi)存變更,操作迅速), CString 直接定義了一個(gè)類型轉(zhuǎn)換函數(shù)
operator LPCTSTR() {......}, 直接返回他所維護(hù)的字符串。
當(dāng)你需要一個(gè)const char* 而傳入了CString時(shí), C++編譯器自動(dòng)調(diào)用 CString重載的操作符 LPCTSTR()來(lái)進(jìn)行隱式的類型轉(zhuǎn)換。
當(dāng)需要CString , 而傳入了 const char* 時(shí)(其實(shí) char* 也可以),C++編譯器則自動(dòng)調(diào)用CString的構(gòu)造函數(shù)來(lái)構(gòu)造臨時(shí)的 CString對(duì)象。
因此CString 和 LPCTSTR 基本可以通用。
但是 LPTSTR又不同了,他是 char*, 意味著你隨時(shí)可能修改里面的數(shù)據(jù),這就需要內(nèi)存管理了(如字符串變長(zhǎng),原來(lái)的存貯空間就不夠了,則需要重新調(diào)整分配內(nèi)存)。
所以 不能隨便的將 const char* 強(qiáng)制轉(zhuǎn)換成 char* 使用。
樓主舉的例子
LPSTR lpstr = (LPSTR)(LPCTSTR)string;
就是這種不安全的使用方法。
這個(gè)地方使用的是強(qiáng)制類型轉(zhuǎn)換,你都強(qiáng)制轉(zhuǎn)換了,C++編譯器當(dāng)然不會(huì)拒絕你,但同時(shí)他也認(rèn)為你確實(shí)知道自己要做的是什么。因此是不會(huì)給出警告的。
強(qiáng)制的任意類型轉(zhuǎn)換是C(++)的一項(xiàng)強(qiáng)大之處,但也是一大弊端。這一問(wèn)題在 vc6 以后的版本(僅針對(duì)vc而言)中得到逐步的改進(jìn)(你需要更明確的類型轉(zhuǎn)換聲明)。
其實(shí)在很多地方都可以看到類似
LPSTR lpstr = (LPSTR)(LPCTSTR)string;
地用法,這種情況一般是函數(shù)的約束定義不夠完善的原因, 比如一個(gè)函數(shù)接受一個(gè)字符串參數(shù)的輸入,里面對(duì)該字符串又沒(méi)有任何的修改,那么該參數(shù)就應(yīng)該定義成 const char*, 但是很多初學(xué)者弄不清const地用法,或者是懶, 總之就是隨意寫(xiě)成了 char* 。 這樣子傳入CString時(shí)就需要強(qiáng)制的轉(zhuǎn)換一下。
這種做法是不安全的,也是不被建議的用法,你必須完全明白、確認(rèn)該字符串沒(méi)有被修改。
CString 轉(zhuǎn)換到 LPTSTR (char*), 預(yù)定的做法是調(diào)用CString的GetBuffer函數(shù),使用完畢之后一般都要再調(diào)用ReleaseBuffer函數(shù)來(lái)確認(rèn)修改 (某些情況下也有不調(diào)用ReleaseBuffer的,同樣你需要非常明確為什么這么做時(shí)才能這樣子處理,一般應(yīng)用環(huán)境可以不考慮這種情況)。
同時(shí)需要注意的是, 在GetBuffer 和 ReleaseBuffer之間,CString分配了內(nèi)存交由你來(lái)處理,因此不能再調(diào)用其他的CString函數(shù)。
CString 轉(zhuǎn)LPCTSTR:
CString cStr;
const char *lpctStr=(LPCTSTR)cStr;
LPCTSTR轉(zhuǎn)CString:
LPCTSTR lpctStr;
CString cStr=lpctStr;