memset

memset

memset是計算機中C/C++語言初始化函數。作用是將某一塊內存中的內容全部設置為指定的值,這個函數通常為新申請的內存做初始化工作。

函數介紹


void *memset(void *s, int ch, size_t n);
函數解釋:將s中當前位置後面的n個位元組(typedef unsigned int size_t )用 ch 替換並返回 s 。
memset:作用是在一段內存塊中填充某個給定的值,它是對較大的結構體或數組進行清零操作的一種最快方法。
memset()函數原型是extern void *memset(void *buffer, int c, int count) buffer:為指針或是數組,c:是賦給buffer的值,count:是buffer的長度.

常見錯誤


第一:memset函數按位元組對內存塊進行初始化,所以不能用它將int數組初始化為0和-1之外的其他值(除非該值高位元組和低位元組相同)。
第二:memset(void *s, int ch,size_t n);中ch實際範圍應該在0~~255,因為該函數只能取ch的后八位賦值給你所輸入的範圍的每個位元組,比如int a[5]賦值memset(a,-1,sizeof(int )*5)與memset(a,511,sizeof(int )*5)所賦值的結果是一樣的都為-1;因為-1的二進位碼為(11111111 11111111 11111111 11111111)而511的二進位碼為(00000000 00000000 00000001 11111111)后八位都為(11111111),所以數組中每個位元組,如a[0]含四個位元組都被賦值為(11111111),其結果為a[0](11111111 11111111 11111111 11111111),即a[0]=-1,因此無論ch多大隻有后八位二進位有效,而後八位二進位的範圍在(0~255)中改。而對字元數組操作時則取后八位賦值給字元數組,其八位值作為ASCII碼。
第三:搞反了 ch 和 n 的位置.
一定要記住如果要把一個char a[20]清零,一定是 memset(a,0,20*sizeof(char));
而不是 memset(a,20*sizeof(char),0);
第四:過度使用memset.
1
2
3
4
char buffer[4];
memset(buffer,0,sizeof(char)*4);
strcpy(buffer,"123");
//"123"中最後隱藏的'\0'佔一位,總長4位。
這裡的memset是多餘的. 因為這塊內存馬上就被全部覆蓋,清零沒有意義.
另:以下情況並不多餘,因某些編譯器分配空間時,內存中默認值並不為0:
1
2
3
4
5
6
7
char buffer[20];
memset(buffer,0,sizeof(char)*20);
memcpy(buffer,"123",3);
//這一條的memset並不多餘,memcpy並沒把buffer全部覆蓋,如果沒有memset,
//用printf列印buffer會有亂碼甚至會出現段錯誤。
//如果此處是strcpy(buffer,"123");便不用memset,
//strcpy雖然不會覆蓋buffer但是會拷貝字元串結束符
第五:
1
2
3
4
5
6
7
int some_func(struct something *a)
{
memset(a,0,sizeof(a));
}
其實這個錯誤嚴格來講不能算用錯memset,但是它經常在使用memset的場合出現。這裡錯誤的原因是VC函數傳參過程中的指針降級,導致sizeof(a),返回的是一個something*指針類型大小的的位元組數,如果是32位,就是4位元組。

常見問題


1,問:為何要用memset置零?memset(&Address,0,sizeof(Address));經常看到這樣的用法,其實不用的話,分配數據的時候,剩餘的空間也會置零的。
答:i.如果不清空,可能會在測試當中出現野值。你做下面的試驗看看結果
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#include 
#include 
#include 
using namespace std;
int main()
{
char buf[5];
CString str;
CString str1;
CString str2;
memset(buf,0,sizeof(buf));
for(int i=0;i<5;i++)
{
str.Format("%d",buf[i]);
str1+=str;
}
str2.Format("%d",str1);
cout<
system("pause");
return 0;
}
這樣寫,有沒有memset,輸出都是一樣
ii.其實不然!特別是對於字元指針類型的,剩餘的部分通常是不會為0的,不妨作一個試驗,定義一個字元數組,並輸入一串字元,如果不用memset實現清零,使用MessageBox顯示出來就會有亂碼(0表示NULL,如果有,就默認字元結束,不會輸出後面的亂碼)
2,問:如下demo是可以的,能把數組中的元素值都設置成字元1,
1
2
3
4
5
6
7
8
9
10
11
12
#include 
#include 
using namespace std;
int main()
{
char a[5];
memset(a,'1',5);
for(int i=0;i<5;i++)
cout<
system("pause");
return 0;
}
而,如下程序想把數組中的元素值設置成1,卻是不可行的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#include 
#include 
#include 
using namespace std;
int main()
{
int a[5];
memset(a,1,20);
 
//也等價於memset(a,1,sizeof(a));.
for(int i=0;i<5;i++)
cout<
system("pause");
return 0;
}
問題是:第一個程序為什麼可以,而第二個不行?
答:因為第一個程序的數組a是字元型的,字元型佔據內存大小是1Byte,而memset函數也是以位元組為單位進行賦值的,所以你輸出沒有問題。而第二個程序a是整型的,使用 memset還是按位元組賦值,這樣賦值完以後,每個數組元素的值實際上是0x01010101即十進位的16843009。
如果用memset(a,1,20),就是對a指向的內存的20個位元組進行賦值,每個都用數1去填充,轉為二進位后,1就是00000001,佔一個位元組。一個int元素是4位元組,合一起是0000 0001,0000 0001,0000 0001,0000 0001,轉化成十六進位就是0x01010101,就等於16843009,就完成了對一個int元素的賦值了。
3,不想要用for,或是while循環來初始化int a[5];能做到嗎?
答:能做到,但這樣是比較麻煩的,memset是最快捷的方法。

程序範例


Eg1.
1
2
3
4
5
6
7
8
9
10
11
12
#include 
#include 
#include 
 
int main(void)
{
char buffer[]="Helloworld\n";
printf("Buffer before memset:%s\n",buffer);
memset(buffer,'*',strlen(buffer));
printf("Buffer after memset:%s\n",buffer);
return 0;
}
輸出結果:
1
2
3
Buffer before memset:Helloworld
 
Buffer after memset:***********
另一種寫法(C++):
1
2
3
4
5
6
7
8
9
10
11
#include
#include
using namespace std;
int main()
{
char buffer[]="Helloworld\n";
cout<<"Buffer before memset:"<
memset(buffer,'*',strlen(buffer));
cout<<"Buffer after memset:"<
return 0;
}
輸出結果相同,只不過這一種寫法僅限於在C++編譯平台(見下文)運行。
編譯平台:
Microsoft Visual C++6.0
也不一定就是把內容全部設置為ch指定的ASCⅡ值,而且該處的ch可為int或者其他類型,並不一定要是char類型。例如下面這樣:
Eg2.
1
2
3
4
5
6
7
8
9
int array[5]={1,4,3,5,2};
for(int i=0;i<5;i++)
cout<
cout<
 
memset(array,0,5*sizeof(int));
for(int k=0;k<5;k++)
cout<
cout<
輸出的結果就是:
1
2
14352
00000
後面的表示大小的參數是以位元組為單位,所以,對於int或其他的就並不是都乘默認的1(字元型)了。而且不同的機器上int的大小也可能不同,所以最好用sizeof()。
要注意的是,memset是對位元組進行操作,
所以上述程序如果改為
1
2
3
4
5
6
7
8
9
int array[5]={1,4,3,5,2};
for(int i=0;i<5;i++)
cout<
cout<
 
memset(array,1,5*sizeof(int));//注意這裡與上面的程序不同
for(int k=0;k<5;k++)
cout<
cout<
輸出的結果就是:
1
2
14352
1684300916843009168430091684300916843009
為什麼呢?
因為memset是以位元組為單位就是對array指向的內存的4個位元組進行賦值,4個位元組合一起就是
100000001000000010000000100000001
就等於16843009,就完成了對一個INT元素的賦值了。
所以用memset對非字元型數組賦初值是不可取的!
對於結構體
有一個結構體Some x,可以這樣清零:
1memset(&x,0,sizeof(Some));
如果是一個結構體的數組Some x[10],可以這樣:
1memset(x,0,sizeof(Some)*10);
Eg3.
1
2
3
4
5
6
7
8
9
10
11
int main()
{
char *s="GoldenGlobalView";
clrscr();
memset(s,'G',6); //這裡沒有問題,可以編譯運行
//單步運行到這裡會提示內存訪問衝突
//肯定會訪問衝突,s指向的是不可寫空間。
printf("%s",s);
getchar();
return 0;
}
以上例子出現內存訪問衝突應該是因為s被當做常量放入程序存儲空間,如果修改為 char s[]="Golden Global View";則沒有問題了。

函數作用範例


1,memset() 函數常用於內存空間初始化。如:
1
2
char str[100];
memset(str,0,100);
2,memset()的深刻內涵:用來對一段內存空間全部設置為某個字元,一般用在對定義的字元串進行初始化
例如:memset(a,'\0',sizeof(a));
3,memset可以方便地清空一個結構類型的變數或數組。
如:
1
2
3
4
5
6
struct sample_struct
{
char csName[16];
int iSeq;
int iType;
};
對於變數
1struct sample_struct stTest;
一般情況下,清空stTest的方法:
1
2
3
stTest.csName[0]={'\0'};
stTest.iSeq=0;
stTest.iType=0;
用memset就非常方便:
1memset(&stTest,0,sizeof(sample_struct));
如果是數組:
1structsample_struct TEST[10];
1memset(TEST,0,sizeof(structsample_struct)*10);
另外:
如果結構體中有數組的話還是需要對數組單獨進行初始化處理的。