精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<strong id="kamqi"><s id="kamqi"></s></strong>

<source id="kamqi"></source>

<kbd id="kamqi"><li id="kamqi"></li></kbd>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

Python數(shù)據(jù)科學：線性回歸

人閱讀
2019-01-24 09:31:00
相關關鍵詞
- 人工智能
- AI

變量分析：

①相關分析：一個連續(xù)變量與一個連續(xù)變量間的關系。

②雙樣本t檢驗：一個二分分類變量與一個連續(xù)變量間的關系。

③方差分析：一個多分類分類變量與一個連續(xù)變量間的關系。

④卡方檢驗：一個二分分類變量或多分類分類變量與一個二分分類變量間的關系。

本次介紹：

線性回歸：多個連續(xù)變量與一個連續(xù)變量間的關系。

其中線性回歸分為簡單線性回歸和多元線性回歸。

／ 01 ／數(shù)據(jù)分析與數(shù)據(jù)挖掘

數(shù)據(jù)庫：一個存儲數(shù)據(jù)的工具。因為Python是內(nèi)存計算，難以處理幾十G的數(shù)據(jù)，所以有時數(shù)據(jù)清洗需在數(shù)據(jù)庫中進行。

統(tǒng)計學：針對小數(shù)據(jù)的數(shù)據(jù)分析方法，比如對數(shù)據(jù)抽樣、描述性分析、結果檢驗。

人工智能／機器學習／模式識別：神經(jīng)網(wǎng)絡算法，模仿人類神經(jīng)系統(tǒng)運作，不僅可以通過訓練數(shù)據(jù)進行學習，而且還能根據(jù)學習的結果對未知的數(shù)據(jù)進行預測。

／ 02 ／回歸方程

01 簡單線性回歸

簡單線性回歸只有一個自變量與一個因變量。

含有的參數(shù)有「回歸系數(shù)」「截距」「擾動項」。

其中「擾動項」又稱「隨機誤差」，服從均值為0的正態(tài)分布。

線性回歸的因變量實際值與預測值之差稱為「殘差」。

線性回歸旨在使殘差平方和最小化。

下面以書中的案例，實現(xiàn)一個簡單線性回歸。

建立收入與月均信用卡支出的預測模型。

import numpy as np

import pandas as pd

import statsmodels．a(chǎn)pi as sm

import matplotlib．pyplot as plt

from statsmodels．formula．a(chǎn)pi import ols

＃消除pandas輸出省略號情況及換行情況

pd．set＿option（＇display．max＿columns＇， 500）

pd．set＿option（＇display．width＇， 1000）

＃讀取數(shù)據(jù)，skipinitialspace：忽略分隔符后的空白

df ＝ pd．read＿csv（＇creditcard＿exp．csv＇， skipinitialspace＝True）

print（df．head（））

讀取數(shù)據(jù)，數(shù)據(jù)如下。

對數(shù)據(jù)進行相關性分析。

＃獲取信用卡有支出的行數(shù)據(jù)

exp ＝ df［df［＇avg＿exp＇］．notnull（）］．copy（）．iloc［：， 2：］．drop（＇age2＇， axis＝1）

＃獲取信用卡無支出的行數(shù)據(jù)，NaN

exp＿new ＝ df［df［＇avg＿exp＇］．isnull（）］．copy（）．iloc［：， 2：］．drop（＇age2＇， axis＝1）

＃描述性統(tǒng)計分析

exp．describe（include＝＇all＇）

print（exp．describe（include＝＇all＇））

＃相關性分析

print（exp［［＇avg＿exp＇，＇Age＇，＇Income＇，＇dist＿home＿val＇］］．corr（method＝＇pearson＇））

輸出結果。

發(fā)現(xiàn)收入（Income）和平均支出（avg＿exp）相關性較大，值為0．674。

使用簡單線性回歸建立模型。

＃使用簡單線性回歸建立模型

lm＿s ＝ ols（＇avg＿exp ～ Income＇， data＝exp）．fit（）

print（lm＿s．params）

＃輸出模型基本信息，回歸系數(shù)及檢驗信息，其他模型診斷信息

print（lm＿s．summary（））

一元線性回歸系數(shù)的輸出結果如下。

從上可知，回歸系數(shù)值為97．73，截距值為258．05。

模型概況如下。

其中R值為0．454，P值接近于0，所以模型還是有一定參考意義的。

使用線性回歸模型測試訓練數(shù)據(jù)集，得出其預測值及殘差。

＃生成的模型使用predict產(chǎn)生預測值，resid為訓練數(shù)據(jù)集的殘差

print（pd．DataFrame（［lm＿s．predict（exp）， lm＿s．resid］， index＝［＇predict＇，＇resid＇］）．T．head（））

輸出結果，可與最開始讀取數(shù)據(jù)時輸出的結果對比一下。

使用模型測試預測數(shù)據(jù)集的結果。

＃對待預測數(shù)據(jù)集使用模型進行預測

print（lm＿s．predict（exp＿new）［：5］）

輸出結果。

12下一頁>

（免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內(nèi)容或斷開相關鏈接。）

為您推薦

極客觀察

欄目相關

ChatGPT每月碳排放：比往返紐約至倫敦航班還多

贊助商

極客網(wǎng)熱搜關鍵詞

人工智能 AI OpenAI ChatGPT 機器學習生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI Akamai AI人工智能昇騰AI 生成式人工智能 AIPC Air AI技術谷歌AI 蘋果AI GenAI 百度AI 科大訊飛AI學習機 AI手機 CAICT 阿爾法蛋AI詞典筆T10 微軟AI 華為AI AI+ 松鼠AI AI模型昇騰AI創(chuàng)新大賽 AIS Airdoc xAI WAIC 智譜AI AITO 京東AI 阿爾法蛋AI詞典筆 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI應用人工智能大會 AI眼鏡 AI算力 AI創(chuàng)企移動AI時代 AI醫(yī)療浙大AIF 人工智能技術 Zain AI人才 Airtag 人工智能芯片 AI服務器 AI投資 AI時代騰訊AI AI算法 BrainCo AI教育 AI框架聯(lián)想AI Gmail 人工智能計算中心 Airwallex空中云匯 VAIO AI賦能人工智能大賽 Chain Coremail AI搜索 OPENAIGC開發(fā)者大賽谷歌人工智能 Airwheel 昇騰AI開發(fā)者創(chuàng)享日 Mirai 人工智能名片人工智能機器人 AI基礎設施 AI聊天機器人阿里AI AI音樂 BrainCo強腦科技通用人工智能人工智能+ AI計算英偉達AI芯片 AI助手 AIOps

上一篇

讓AI代替人眼工作視覺機器來了

下一篇

亞馬遜測試快遞機器人：跟小冰箱一樣大

簡版
原版
投稿
回頂部

2019-01-24

Python數(shù)據(jù)科學：線性回歸

變量分析：①相關分析：一個連續(xù)變量與一個連續(xù)變量間的關系。②雙樣本t檢驗：一個二分分類變量與一個連續(xù)變量間的關系。③方差分析：一個多分類分類變量與一個連續(xù)變量間的關系。

長按掃碼閱讀全文