奧推網

選單
科技

【第736期】小白必備:初學者別上爬蟲爬蟲的2個常見問題

一般而言,Python幾個月就可以開始使用了。假如你幾個月沒入門,那肯定是方法不對,或者是偷懶。我在公眾號裡有一篇文章詳細寫了“初學者別上爬蟲”,爬蟲雖然很有趣,但不適合於小白使用者。以下是2點:

Python再簡單再通俗,它也是一門語言,掌握一門語言絕非一朝一夕,我個人不推薦初學者上岸學習爬蟲,我舉一個很簡單的列子,爬蟲可以使用很多第三方庫,許多模組,以及許多內建的庫,正則表示式。

。有些同學在學習py2和py3時還沒有弄清楚,字典表還沒有用熟練,就上來按例子敲擊一下,運氣好的話,執行成功;運氣不好的,可能要除錯半天,即使你學習了一些爬蟲基礎,當你學習像scrapy這樣的爬蟲框架時,你也會很吃力,比如裡面會有大量的yield,大量的正則表示式,你根本就不懂基本的語法,試問一下,你怎麼可能學習通透,看懂了,更不說懂了,自己能靈活運用。

尤其是那些沒有基礎的同學,或者其他非計算機專業的,跨界過來的,很多都會受到爬蟲或機器學習的吸引,網上這樣的文章很多,非常吸引眼球,但老實說,這類文章對初學者來說,很容易受誘惑。

遇到問題會很痛苦,有可能會挫傷學習Python的積極性,如果周圍沒有人及時引導,有些就乾脆不學了。

附加一點:

所以爬蟲什麼時候學習,爬蟲真的很好玩,我建議你剛開始學習爬蟲時,有一定的基礎。

事實上,爬行動物只是一條獲取資料的途徑,如果要玩資料分析,爬行動物只佔不到1/3。

奠定基礎是最重要的事情。

Python的開發方向。

Python有許多發展方向,比如web開發,Django/flask都是很好的框架;可以做資料分析,資料分析需要學習很多東西(Pandas/Numpy,資料庫SQL/MongoDB,資料視覺化Matplotlib,sns,ggplot,Tableau);機器學習(統計學,機率論,演算法集)等等。

以上三個方面,都是很好的方向。初學者很容易分心,今天聽人說web開發很有前途,學習一週Django,明天說資料分析,開始學習Pandas。後臺資料探勘也很好,開始學習sklearn。這樣到頭來很容易分散精力,你什麼都學,就等於什麼都沒學。

小編認為更好的方向是:Python入門後,狂寫程式將基礎打牢,然後開始選擇有趣的方向:

比如,給自己1個月的時間,拿到Django,建立一個小型的web站點來玩。不完成目標,就不要分心去學習資料分析和資料探勘。在建立網站的過程中,你會遇到一些問題,會發現自己的基礎薄弱環節,透過這種方式,反過來又不斷地彌補自己的不足。因此,進一步提升自己的功力。當您完成網站的搭建後,您會更有成就感,您會發現您的Python功力也提升到了一個新的高度。

當然你也可以選擇從資料分析開始,過程與前面相似,主要看你的興趣和偏好。

怎樣學好Python?

在這些練習中,最重要的還是要多練習,多思考,多練習,再投入時間。本人認為學習程式碼沒有什麼捷徑可走,因為程式設計是個需要實戰性的過程,光看書本上的程式碼,看著就會前忘後,知識非常豐富,非常零碎。有大量的API庫,有大量的語法和函式。不敲幾遍,就難以領悟,也難以理解。別人說千遍萬遍,不如你花時間敲兩遍。

簡而言之:透過實戰提高自己的功力,但不能貪圖多方面的突破,要從一點突破,以戰養練,以練補戰。