日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
Linux下用C語言編寫網(wǎng)絡(luò)爬蟲實現(xiàn)數(shù)據(jù)爬取(linuxc語言網(wǎng)絡(luò)爬蟲)

網(wǎng)絡(luò)爬蟲是指一種程序或腳本,自動抓取互聯(lián)網(wǎng)網(wǎng)頁信息并提取相關(guān)數(shù)據(jù)。Linux下使用C語言編寫網(wǎng)絡(luò)爬蟲可以實現(xiàn)高效穩(wěn)定的網(wǎng)頁內(nèi)容采集。本文將介紹如何通過編程技巧實現(xiàn)網(wǎng)絡(luò)爬蟲,展現(xiàn)其實現(xiàn)數(shù)據(jù)挖掘的強大功能。

一. 實現(xiàn)一個簡單的網(wǎng)絡(luò)爬蟲接口

由于網(wǎng)絡(luò)爬蟲與互聯(lián)網(wǎng)信息流的迅速變化相關(guān),因此需要使用程序來掃描不斷變化的網(wǎng)頁,這需要程序員首先實現(xiàn)基本的爬蟲接口。

網(wǎng)絡(luò)爬蟲通過發(fā)出HTTP請求來獲取數(shù)據(jù),因此需要用到一個HTTP客戶端庫,例如“curl”。C語言對于處理HTTP請求以及解析HTML文件非常自然。下面是一個基本的爬蟲接口:

“`c

#include

#include

#include

int mn(int argc, char *argv[])

{

CURL *curl_handle;

CURLcode res;

curl_global_init(CURL_GLOBAL_ALL);

curl_handle = curl_easy_init();

if(curl_handle) {

curl_easy_setopt(curl_handle, CURLOPT_URL, “https://www.example.com/”);

curl_easy_setopt(curl_handle, CURLOPT_FOLLOWLOCATION, 1L);

res = curl_easy_perform(curl_handle);

if(res != CURLE_OK)

printf(“curl_easy_perform() fled: %s\n”,

curl_easy_strerror(res));

curl_easy_cleanup(curl_handle);

}

curl_global_cleanup();

return 0;

}

“`

這個程序使用了curl庫來執(zhí)行HTTP客戶端請求。此處將獲取“https://www.example.com/”網(wǎng)站的主頁。程序中還使用了curl_easy_setopt函數(shù)來指定選項,如上述的CURLOPT_FOLLOWLOCATION選項,該選項用于指示curl庫應(yīng)該跟蹤頁面的重定向。程序使用curl_easy_cleanup函數(shù)來清理curl_handler并釋放資源。

二. 實際數(shù)據(jù)抓取演示

接下來,介紹如何實際地爬取數(shù)據(jù)。

1. 獲取網(wǎng)頁源代碼

要獲取網(wǎng)頁源代碼,需要使用curl庫,將curl_easy_setopt(CURLOPT_WRITEFUNCTION, write_data)設(shè)置為回調(diào)函數(shù),例如以下函數(shù):

“`c

static size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)

{

size_t written = fwrite(ptr, size, nmemb, (FILE *)stream);

return written;

}

“`

將之前的代碼結(jié)合起來,即得到以下代碼:

“`c

#include

#include

#include

static size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)

{

size_t written = fwrite(ptr, size, nmemb, (FILE *)stream);

return written;

}

int mn(int argc, char *argv[])

{

CURL *curl_handle;

CURLcode res;

FILE *pagefile;

curl_global_init(CURL_GLOBAL_ALL);

curl_handle = curl_easy_init();

if(curl_handle) {

curl_easy_setopt(curl_handle, CURLOPT_URL, “https://www.example.com/”);

curl_easy_setopt(curl_handle, CURLOPT_FOLLOWLOCATION, 1L);

pagefile = fopen(“page.out”, “wb”);

if(pagefile) {

curl_easy_setopt(curl_handle, CURLOPT_WRITEFUNCTION, write_data);

curl_easy_setopt(curl_handle, CURLOPT_WRITEDATA, pagefile);

res = curl_easy_perform(curl_handle);

fclose(pagefile);

}

if(res != CURLE_OK)

printf(“curl_easy_perform() fled: %s\n”,

curl_easy_strerror(res));

curl_easy_cleanup(curl_handle);

}

curl_global_cleanup();

return 0;

}

“`

2. 提取數(shù)據(jù)

抓取網(wǎng)頁源代碼之后,就可以使用HTML解析器提取感興趣的信息。

例如,要提取頁面中的所有鏈接,可以使用libxml2庫,例如以下函數(shù):

“`c

#include

static void parse_html_links(const char *filename)

{

xmlDoc *doc = htmlReadFile(filename, NULL, HTML_PARSE_NOBLANKS | HTML_PARSE_NOERROR | HTML_PARSE_NOWARNING);

xmlNode *root_element = xmlDocGetRootElement(doc);

xmlNode *cur_node = NULL;

for (cur_node = root_element; cur_node; cur_node = cur_node->next) {

if (cur_node->type == XML_ELEMENT_NODE && !xmlStrcasecmp(cur_node->name, “a”)) {

xmlAttr *attr = cur_node->properties;

while (attr) {

if (!xmlStrcasecmp(attr->name, “href”)) {

printf(“%s\n”, attr->children->content);

}

attr =attr->next;

}

}

}

xmlFreeDoc(doc);

xmlCleanupParser();

}

“`

3. 結(jié)合數(shù)據(jù)

有了這兩個函數(shù),可以將它們結(jié)合起來,以爬取數(shù)據(jù):

“`c

#include

#include

#include

#include

static size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)

{

size_t written = fwrite(ptr, size, nmemb, (FILE *)stream);

return written;

}

static void parse_html_links(const char *filename)

{

xmlDoc *doc = htmlReadFile(filename, NULL, HTML_PARSE_NOBLANKS | HTML_PARSE_NOERROR | HTML_PARSE_NOWARNING);

xmlNode *root_element = xmlDocGetRootElement(doc);

xmlNode *cur_node = NULL;

for (cur_node = root_element; cur_node; cur_node = cur_node->next) {

if (cur_node->type == XML_ELEMENT_NODE && !xmlStrcasecmp(cur_node->name, “a”)) {

xmlAttr *attr = cur_node->properties;

while (attr) {

if (!xmlStrcasecmp(attr->name, “href”)) {

printf(“%s\n”, attr->children->content);

}

attr =attr->next;

}

}

}

xmlFreeDoc(doc);

xmlCleanupParser();

}

int mn(int argc, char *argv[])

{

CURL *curl_handle;

CURLcode res;

FILE *pagefile;

curl_global_init(CURL_GLOBAL_ALL);

curl_handle = curl_easy_init();

if(curl_handle) {

curl_easy_setopt(curl_handle, CURLOPT_URL, “https://www.example.com/”);

curl_easy_setopt(curl_handle, CURLOPT_FOLLOWLOCATION, 1L);

pagefile = fopen(“page.out”, “wb”);

if(pagefile) {

curl_easy_setopt(curl_handle, CURLOPT_WRITEFUNCTION, write_data);

curl_easy_setopt(curl_handle, CURLOPT_WRITEDATA, pagefile);

res = curl_easy_perform(curl_handle);

fclose(pagefile);

}

if(res == CURLE_OK)

parse_html_links(“page.out”);

curl_easy_cleanup(curl_handle);

}

curl_global_cleanup();

return 0;

}

“`

以上代碼將網(wǎng)頁源代碼保存到文件中,然后從文件中讀取HTML數(shù)據(jù),并從HTML數(shù)據(jù)中提取所有鏈接。這是網(wǎng)絡(luò)爬蟲中最常見的技術(shù)之一。

三. 結(jié)語

成都網(wǎng)站建設(shè)公司-創(chuàng)新互聯(lián),建站經(jīng)驗豐富以策略為先導10多年以來專注數(shù)字化網(wǎng)站建設(shè),提供企業(yè)網(wǎng)站建設(shè),高端網(wǎng)站設(shè)計,響應(yīng)式網(wǎng)站制作,設(shè)計師量身打造品牌風格,熱線:028-86922220

怎樣學習在linux操作系統(tǒng)下用C語言編程

這篇文章介紹在LINUX下進行C語言編程所需要的基礎(chǔ)知識.在這篇文章當中,我們將會學到以下內(nèi)容:

源程序編譯

Makefile的編寫

程序庫的鏈接

程序的調(diào)試

頭文件和系統(tǒng)求助

1.源程序的編譯

在Linux下面,如果要編譯一個C語言源程序,我們要使用GNU的gcc編譯器. 下面我們以一個實例來說明如何使用gcc編譯器.

假設(shè)我們有下面一個非常簡單的源程序(hello.c):

int main(int argc,char **argv)

{

printf(“Hello Linux\n”);

}

要編譯這個程序,我們只要在命令行下執(zhí)行:

gcc -o hello hello.c

gcc 編譯器就會為我們生成一個hello的可執(zhí)行文件.執(zhí)行./hello就可以看到程序的輸出結(jié)果了.命令行中

gcc表示我們是用gcc來編譯我們的源程序,-o 選項表示我們要求編譯器給我們輸出的可執(zhí)行文件名為hello

而hello.c是我們的源程序文件. gcc編譯器有許多選項,一般來說我們只要知道其中的幾個就夠了. -o選項我們已經(jīng)知道了,表示我們要求輸出的可執(zhí)行文件名.

-c選項表示我們只要求編譯器輸出目標代碼,而不必要輸出可執(zhí)行文件. -g選項表示我們要求編譯器在編譯的時候團含提供我們以后對程序進行調(diào)試的信息. 知道了這三個選項,我們就可以編譯我們自己所寫的簡單的源程序了,如果你想要知道更多的選項,可以查看gcc的幫助文檔,那里有著許多對其它選項的詳細說明.

2.Makefile的編寫

假設(shè)我們有下面這樣的一個程序,源代碼如下:

/* main.c */

#include “mytool1.h”

#include “mytool2.h”

int main(int argc,char **argv)

{

mytool1_print(“hello”);

mytool2_print(“hello”);

}

/* mytool1.h */

#ifndef _MYTOOL_1_H

#define _MYTOOL_1_H

void mytool1_print(char *print_str);

#endif

/* mytool1.c */

#include “mytool1.h”

void mytool1_print(char *print_str)

{

printf(“This is mytool1 print %s\n”,print_str);

}

/* mytool2.h */

#ifndef _MYTOOL_2_H

#define _MYTOOL_2_H

void mytool2_print(char *print_str);

#endif

/* mytool2.c */

#include “mytool2.h”

void mytool2_print(char *print_str)

{

printf(“This is mytool2 print %s\n”,print_str);

}

當然由于這個程序是很短的我們可以這樣來編譯

gcc -c main.c

gcc -c mytool1.c

gcc -c mytool2.c

gcc -o main main.o mytool1.o mytool2.o

這樣的話我們也可以產(chǎn)生main程序,而且也不時很麻煩.但是如果我們考慮一下如果有一天我們修改了其中的一個文件(比如說mytool1.c)

那么我們難道還要重新輸入上面的命令?也許你會說,這個很容易解決啊,我寫一個SHELL腳本,讓她幫我去完成不就可以了.是的對于這個程序來說,是可以

起到作用的.但是當我們把事情想的更復雜一點,如果我們的程序有幾百個源程序的時候,難道也要編譯器重新一個一個的去編譯? 為此,聰明的程序員們想出了一個很好的工具來做這件余納事情,這就是make.我們只要執(zhí)行以下make,就可以把上面的問題豎或沒解決掉.在我們執(zhí)行

make之前,我們要先編寫一個非常重要的文件.–Makefile.對于上面的那個程序來說,可能的一個Makefile的文件是: # 這是上面那個程序的Makefile文件

main:main.o mytool1.o mytool2.o

gcc -o main main.o mytool1.o mytool2.o

main.o:main.c mytool1.h mytool2.h

gcc -c main.c

mytool1.o:mytool1.c mytool1.h

gcc -c mytool1.c

mytool2.o:mytool2.c mytool2.h

gcc -c mytool2.c

有了這個Makefile文件,不過我們什么時候修改了源程序當中的什么文件,我們只要執(zhí)行make命令,我們的編譯器都只會去編譯和我們修改的文件有關(guān)的文件,其它的文件她連理都不想去理的.

下面我們學習Makefile是如何編寫的.

在Makefile中也#開始的行都是注釋行.Makefile中最重要的是描述文件的依賴關(guān)系的說明.一般的格式是:

target: components

TAB rule

之一行表示的是依賴關(guān)系.第二行是規(guī)則.

比如說我們上面的那個Makefile文件的第二行

main:main.o mytool1.o mytool2.o

表示我們的目標(target)main的依賴對象(components)是main.o mytool1.o mytool2.o

當倚賴的對象在目標修改后修改的話,就要去執(zhí)行規(guī)則一行所指定的命令.就象我們的上面那個Makefile第三行所說的一樣要執(zhí)行 gcc -o

main main.o mytool1.o mytool2.o 注意規(guī)則一行中的TAB表示那里是一個TAB鍵 Makefile有三個非常有用的變量.分別是$@,$^,$

int main(int argc,char **argv)

{

double value;

printf(“Value:%f\n”,value);

}

這個程序相當簡單,但是當我們用 gcc -o temp temp.c 編譯時會出現(xiàn)下面所示的錯誤.

/tmp/cc33Kydu.o: In function `main’:

/tmp/cc33Kydu.o(.text+0xe): undefined reference to `log’

collect2: ld returned 1 exit status

出現(xiàn)這個錯誤是因為編譯器找不到log的具體實現(xiàn).雖然我們包括了正確的頭文件,但是我們在編譯的時候還是要連接確定的庫.在Linux下,為了

使用數(shù)學函數(shù),我們必須和數(shù)學庫連接,為此我們要加入 -lm 選項. gcc -o temp temp.c

-lm這樣才能夠正確的編譯.也許有人要問,前面我們用printf函數(shù)的時候怎么沒有連接庫呢?是這樣的,對于一些常用的函數(shù)的實現(xiàn),gcc編譯器會自

動去連接一些常用庫,這樣我們就沒有必要自己去指定了. 有時候我們在編譯程序的時候還要指定庫的路徑,這個時候我們要用到編譯器的

-L選項指定路徑.比如說我們有一個庫在 /home/hoyt/mylib下,這樣我們編譯的時候還要加上

-L/home/hoyt/mylib.對于一些標準庫來說,我們沒有必要指出路徑.只要它們在起缺省庫的路徑下就可以了.系統(tǒng)的缺省庫的路徑/lib

/usr/lib /usr/local/lib 在這三個路徑下面的庫,我們可以不指定路徑. 還有一個問題,有時候我們使用了某個函數(shù),但是我們不知道庫的名字,這個時候怎么辦呢?很抱歉,對于這個問題我也不知道答案,我只有一個傻辦

法.首先,我到標準庫路徑下面去找看看有沒有和我用的函數(shù)相關(guān)的庫,我就這樣找到了線程(thread)函數(shù)的庫文件(libpthread.a).

當然,如果找不到,只有一個笨方法.比如我要找sin這個函數(shù)所在的庫. 就只好用 nm -o /lib/*.so|grep

sin>~/sin 命令,然后看~/sin文件,到那里面去找了.

在sin文件當中,我會找到這樣的一行l(wèi)ibm-2.1.2.so:00009fa0 W sin 這樣我就知道了sin在

libm-2.1.2.so庫里面,我用 -lm選項就可以了(去掉前面的lib和后面的版本標志,就剩下m了所以是 -lm).

如果你知道怎么找,請趕快告訴我,我回非常感激的.謝謝! 4.程序的調(diào)試

我們編寫的程序不太可能一次性就會成功的,在我們的程序當中,會出現(xiàn)許許多多我們想不到的錯誤,這個時候我們就要對我們的程序進行調(diào)試了.

最常用的調(diào)試軟件是gdb.如果你想在圖形界面下調(diào)試程序,那么你現(xiàn)在可以選擇xxgdb.記得要在編譯的時候加入

-g選項.關(guān)于gdb的使用可以看gdb的幫助文件.由于我沒有用過這個軟件,所以我也不能夠說出如何使用.

不過我不喜歡用gdb.跟蹤一個程序是很煩的事情,我一般用在程序當中輸出中間變量的值來調(diào)試程序的.當然你可以選擇自己的辦法,沒有必要去學別人的.現(xiàn)

在有了許多IDE環(huán)境,里面已經(jīng)自己帶了調(diào)試器了.你可以選擇幾個試一試找出自己喜歡的一個用.

5.頭文件和系統(tǒng)求助

有時候我們只知道一個函數(shù)的大概形式,不記得確切的表達式,或者是不記得著函數(shù)在那個頭文件進行了說明.這個時候我們可以求助系統(tǒng).

比如說我們想知道fread這個函數(shù)的確切形式,我們只要執(zhí)行 man fread

系統(tǒng)就會輸出著函數(shù)的詳細解釋的.和這個函數(shù)所在的頭文件說明了. 如果我們要write這個函數(shù)的說明,當我們執(zhí)行man

write時,輸出的結(jié)果卻不是我們所需要的.

因為我們要的是write這個函數(shù)的說明,可是出來的卻是write這個命令的說明.為了得到write的函數(shù)說明我們要用 man 2 write.

2表示我們用的write這個函數(shù)是系統(tǒng)調(diào)用函數(shù),還有一個我們常用的是3表示函數(shù)是C的庫函數(shù). 記住不管什么時候,man都是我們的更好助手.

好了,這一章就講這么多了,有了這些知識我們就可以進入激動人心的Linux下的C程序探險活動.

不積跬步,無以至千里!

Linux下C語言編程基礎(chǔ)知識:

1.源程序的編譯

在Linux下面,如果要編譯一個C語言源程序,我們要使用GNU的gcc編譯器. 下面我們以一個實例來說明如何使用gcc編譯器.

假設(shè)我們有下面一個非常簡單的源程序(hello.c):

int main(int argc,char **argv)

{

printf(“Hello Linuxn”);

}

要編譯這個程序,我們只要在命令行下執(zhí)行:

gcc -o hello hello.c

gcc 編譯器就會為我們生成一個hello的可執(zhí)行文件.執(zhí)行./hello就可以看到程序的輸出結(jié)果了.命令行中 gcc表示我們是用gcc來編譯我們的源程序,-o 選項表示我們要求編譯器給我們輸出的可執(zhí)行文件名為hello 而hello.c是我們的源程序文件.

gcc編譯器有許多選項,一般來說我們只要知道其中的幾個就夠了. -o選項我們已經(jīng)知道了,表示我們要求輸出的可執(zhí)行文件名. -c選項表示我們只要求編譯器輸出目標代碼,而不必要輸出可執(zhí)行文件. -g選項表示我們要求編譯器在編譯的時候提供我們以后對程序進行調(diào)試的信息.

知道了這三個選項,我們就可以編譯我們自己所寫的簡大空單的源程序了,如果你想要知道更多的選項,可以查看gcc的幫助文檔,那里有著許多對其它選項的詳細說明.

2.Makefile的編寫

假設(shè)我們有下面這樣的一個程序,源代碼如下:

/* main.c */

#include “mytool1.h”

#include “mytool2.h”

int main(int argc,char **argv)

{

mytool1_print(“hello”);

mytool2_print(“hello”);

}

/* mytool1.h */

#ifndef _MYTOOL_1_H

#define _MYTOOL_1_H

void mytool1_print(char *print_str);

#endif

/* mytool1.c */

#include “mytool1.h”

void mytool1_print(char *print_str)

{

printf(“This is mytool1 print %sn”,print_str);

}

/* mytool2.h */

#ifndef _MYTOOL_2_H

#define _MYTOOL_2_H

void mytool2_print(char *print_str);

#endif

/* mytool2.c */

#include “mytool2.h”

void mytool2_print(char *print_str)

{

printf(“This is mytool2 print %sn”,print_str);

}

當然由于這個程序是很短的我們可以這樣來編譯

gcc -c main.c

gcc -c mytool1.c

gcc -c mytool2.c

gcc -o main main.o mytool1.o mytool2.o

這樣的話我們也可以產(chǎn)生main程序,而且也不時很麻煩.但是如果我們考慮一下如果有一天我們滾大瞎修改了其中的一個文件(比如說mytool1.c)那么我們難道還要重新輸入上面的命令?也許你會說,這個很容易解決啊,我寫一個SHELL腳本,讓她幫我去完成不就可以了.是的對于這個程序來說,是可以起到作用的.但是當我們把事情想的更復雜一點,如果我們的程序有幾百個源程序的時候,難道也要編譯器重仿坦新一個一個的去編譯?

為此,聰明的程序員們想出了一個很好的工具來做這件事情,這就是make.我們只要執(zhí)行以下make,就可以把上面的問題解決掉.在我們執(zhí)行make 之前,我們要先編寫一個非常重要的文件.–Makefile.對于上面的那個程序來說,可能的一個Makefile的文件是:

# 這是上面那個程序的Makefile文件

main:main.o mytool1.o mytool2.o

gcc -o main main.o mytool1.o mytool2.o

main.o:main.c mytool1.h mytool2.h

gcc -c main.c

mytool1.o:mytool1.c mytool1.h

gcc -c mytool1.c

mytool2.o:mytool2.c mytool2.h

gcc -c mytool2.c

有了這個Makefile文件,不過我們什么時候修改了源程序當中的什么文件,我們只要執(zhí)行make命令,我們的編譯器都只會去編譯和我們修改的文件有關(guān)的文件,其它的文件她連理都不想去理的.

下面我們學習Makefile是如何編寫的.

在Makefile中也#開始的行都是注釋行.Makefile中最重要的是描述文件的依賴關(guān)系的說明.一般的格式是:

target: components

TAB rule

之一行表示的是依賴關(guān)系.第二行是規(guī)則.

比如說我們上面的那個Makefile文件的第二行

main:main.o mytool1.o mytool2.o

表示我們的目標(target)main的依賴對象(components)是main.o mytool1.o mytool2.o 當倚賴的對象在目標修改后修改的話,就要去執(zhí)行規(guī)則一行所指定的命令.就象我們的上面那個Makefile第三行所說的一樣要執(zhí)行 gcc -o main main.o mytool1.o mytool2.o 注意規(guī)則一行中的TAB表示那里是一個TAB鍵

Makefile有三個非常有用的變量.分別是$@,$^,$

int main(int argc,char **argv)

{

double value;

printf(“Valuefn”,value);

}

這個程序相當簡單,但是當我們用 gcc -o temp temp.c 編譯時會出現(xiàn)下面所示的錯誤.

/tmp/cc33Kydu.o: In function `main’:

/tmp/cc33Kydu.o(.text+0xe): undefined reference to `log’

collect2: ld returned 1 exit status

出現(xiàn)這個錯誤是因為編譯器找不到log的具體實現(xiàn).雖然我們包括了正確的頭文件,但是我們在編譯的時候還是要連接確定的庫.在Linux下,為了使用數(shù)學函數(shù),我們必須和數(shù)學庫連接,為此我們要加入 -lm 選項. gcc -o temp temp.c -lm這樣才能夠正確的編譯.也許有人要問,前面我們用printf函數(shù)的時候怎么沒有連接庫呢?是這樣的,對于一些常用的函數(shù)的實現(xiàn),gcc編譯器會自動去連接一些常用庫,這樣我們就沒有必要自己去指定了. 有時候我們在編譯程序的時候還要指定庫的路徑,這個時候我們要用到編譯器的 -L選項指定路徑.比如說我們有一個庫在 /home/hoyt/mylib下,這樣我們編譯的時候還要加上 -L/home/hoyt/mylib.對于一些標準庫來說,我們沒有必要指出路徑.只要它們在起缺省庫的路徑下就可以了.系統(tǒng)的缺省庫的路徑/lib /usr/lib /usr/local/lib 在這三個路徑下面的庫,我們可以不指定路徑.

還有一個問題,有時候我們使用了某個函數(shù),但是我們不知道庫的名字,這個時候怎么辦呢?很抱歉,對于這個問題我也不知道答案,我只有一個傻辦法.首先,我到標準庫路徑下面去找看看有沒有和我用的函數(shù)相關(guān)的庫,我就這樣找到了線程(thread)函數(shù)的庫文件(libpthread.a). 當然,如果找不到,只有一個笨方法.比如我要找sin這個函數(shù)所在的庫. 就只好用 nm -o /lib/*.so|grep sin>~/sin 命令,然后看~/sin文件,到那里面去找了. 在sin文件當中,我會找到這樣的一行l(wèi)ibm-2.1.2.so:00009fa0 W sin 這樣我就知道了sin在 libm-2.1.2.so庫里面,我用 -lm選項就可以了(去掉前面的lib和后面的版本標志,就剩下m了所以是 -lm). 如果你知道怎么找,請趕快告訴我,我回非常感激的.謝謝!

4.程序的調(diào)試

我們編寫的程序不太可能一次性就會成功的,在我們的程序當中,會出現(xiàn)許許多多我們想不到的錯誤,這個時候我們就要對我們的程序進行調(diào)試了.

最常用的調(diào)試軟件是gdb.如果你想在圖形界面下調(diào)試程序,那么你現(xiàn)在可以選擇xxgdb.記得要在編譯的時候加入 -g選項.關(guān)于gdb的使用可以看gdb的幫助文件.由于我沒有用過這個軟件,所以我也不能夠說出如何使用. 不過我不喜歡用gdb.跟蹤一個程序是很煩的事情,我一般用在程序當中輸出中間變量的值來調(diào)試程序的.當然你可以選擇自己的辦法,沒有必要去學別人的.現(xiàn)在有了許多IDE環(huán)境,里面已經(jīng)自己帶了調(diào)試器了.你可以選擇幾個試一試找出自己喜歡的一個用.

5.頭文件和系統(tǒng)求助

有時候我們只知道一個函數(shù)的大概形式,不記得確切的表達式,或者是不記得著函數(shù)在那個頭文件進行了說明.這個時候我們可以求助系統(tǒng).

比如說我們想知道fread這個函數(shù)的確切形式,我們只要執(zhí)行 man fread 系統(tǒng)就會輸出著函數(shù)的詳細解釋的.和這個函數(shù)所在的頭文件說明了. 如果我們要write這個函數(shù)的說明,當我們執(zhí)行man write時,輸出的結(jié)果卻不是我們所需要的. 因為我們要的是write這個函數(shù)的說明,可是出來的卻是write這個命令的說明.為了得到write的函數(shù)說明我們要用 man 2 write. 2表示我們用的write這個函數(shù)是系統(tǒng)調(diào)用函數(shù),還有一個我們常用的是3表示函數(shù)是C的庫函數(shù).

記住不管什么時候,man都是我們的更好助手.

linux c語言 網(wǎng)絡(luò)爬蟲的介紹就聊到這里吧,感謝你花時間閱讀本站內(nèi)容,更多關(guān)于linux c語言 網(wǎng)絡(luò)爬蟲,Linux下用C語言編寫網(wǎng)絡(luò)爬蟲實現(xiàn)數(shù)據(jù)爬取,怎樣學習在linux操作系統(tǒng)下用C語言編程的信息別忘了在本站進行查找喔。

成都網(wǎng)站建設(shè)選創(chuàng)新互聯(lián)(?:028-86922220),專業(yè)從事成都網(wǎng)站制作設(shè)計,高端小程序APP定制開發(fā),成都網(wǎng)絡(luò)營銷推廣等一站式服務(wù)。


當前名稱:Linux下用C語言編寫網(wǎng)絡(luò)爬蟲實現(xiàn)數(shù)據(jù)爬取(linuxc語言網(wǎng)絡(luò)爬蟲)
當前地址:http://www.dlmjj.cn/article/djgoiii.html