久久久久久久久久久91_精品国产一区二区三区成人影院_中文字幕第2页_国产精品成人一区二区三区_韩日成人av_欧美久久一区

當(dāng)前位置: 首頁 精選范文 數(shù)據(jù)分析方法范文

數(shù)據(jù)分析方法精選(五篇)

發(fā)布時間:2023-11-10 11:02:46

序言:作為思想的載體和知識的探索者,寫作是一種獨特的藝術(shù),我們?yōu)槟鷾?zhǔn)備了不同風(fēng)格的5篇數(shù)據(jù)分析方法,期待它們能激發(fā)您的靈感。

數(shù)據(jù)分析方法

篇1

1、將收集到的數(shù)據(jù)通過加工、整理和分析的過程,使其轉(zhuǎn)化為信息,通常來說,數(shù)據(jù)分析常用的方法有列表法和作圖法,所謂列表法,就是將數(shù)據(jù)按一定規(guī)律用列表方式表達出來,是記錄和處理數(shù)據(jù)最常用的一種方法。

2、表格設(shè)計應(yīng)清楚表明對應(yīng)關(guān)系,簡潔明了,有利于發(fā)現(xiàn)要相關(guān)量之間的關(guān)系,并且在標(biāo)題欄中還要注明各個量的名稱、符號、數(shù)量級和單位等。

3、而作圖法則能夠醒目地表達各個物理量間的變化關(guān)系,從圖線上可以簡便求出實驗需要的某些結(jié)果,一些復(fù)雜的函數(shù)關(guān)系也可以通過一定的變化用圖形來表現(xiàn)。

(來源:文章屋網(wǎng) )

篇2

關(guān)鍵詞:大數(shù)據(jù);分析模型;房價

中圖分類號:TP399 文獻標(biāo)識碼:A 文章編號:1007-9416(2017)03-0137-02

1 引言

大數(shù)據(jù)分析首先要建立一個分析模型,分析模型是大數(shù)據(jù)分析的基石,只有先建立了模型才能對大數(shù)據(jù)進行分析。構(gòu)建大數(shù)據(jù)分析模型傳統(tǒng)的方法很難實現(xiàn),大數(shù)據(jù)非結(jié)構(gòu)化、屬性很難預(yù)知,通過數(shù)學(xué)、統(tǒng)計學(xué)等方法構(gòu)建大數(shù)據(jù)分析模型都比較困難,機器學(xué)習(xí)是構(gòu)建大數(shù)據(jù)分析模型最有效的方法之一。機器學(xué)習(xí)通過不斷地學(xué)習(xí)優(yōu)化、不斷地迭代逼近所要的模型。

2 訓(xùn)練數(shù)據(jù)準(zhǔn)備

機器學(xué)習(xí)構(gòu)建大數(shù)據(jù)分析模型的方法是通過訓(xùn)練數(shù)據(jù)將模型訓(xùn)練出來。從要研究的大數(shù)據(jù)對象中找出訓(xùn)練集。機器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)需要教師,監(jiān)督機器學(xué)習(xí)的結(jié)果,事先設(shè)定好學(xué)習(xí)目標(biāo),期望的結(jié)果。非監(jiān)督學(xué)習(xí)的數(shù)據(jù)一般都無標(biāo)簽,學(xué)習(xí)結(jié)果事先也無法預(yù)知,通過數(shù)據(jù)可視化等方法觀察學(xué)習(xí)結(jié)果。

房價大數(shù)據(jù)分析模型機器學(xué)習(xí)屬于監(jiān)督學(xué)習(xí),期望預(yù)測值極大地逼近真實值。首先需要采集房價數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),然后設(shè)計房價大數(shù)據(jù)分析模型機器學(xué)習(xí)算法,計算機通過機器學(xué)習(xí)算法和學(xué)習(xí)路徑學(xué)習(xí)訓(xùn)練數(shù)據(jù),學(xué)習(xí)目標(biāo)是預(yù)測的結(jié)果極大地逼近真實數(shù)據(jù),通過反復(fù)迭代,不斷地接近目標(biāo),訓(xùn)練出所希望的模型。

3 數(shù)據(jù)清洗

清洗后的訓(xùn)練數(shù)據(jù)如下:

間數(shù)(x1) x1 2 x1 2 x1 3 x1 3 x1 3 x1 3 x1 2 x1 2 x1 2 x1 3 x1 3 x1 3 x1 2 x1 2 x1 1 x1 3 x1 3 x1 3 x1 3 x1 1 x1 2 x1 2 x1 2 x1 2 x1 2 x1 3 x1 2 x1 3 x1 2 x1 2 x1 3 x1 2 x1 2 x1 3 x1 3 x1 3 x1 2 x1 3 x1 2 x1 1 x1 2 x1 2 x1 2 x1 2

面e(x2) x2 126 x2 99 x2 134 x2 137 x2 135 x2 138 x2 104 x2 99 x2 105 x2 126 x2 112 x2 116 x2 88 x2 90 x2 79 x2 120 x2 155 x2 158 x2 161 x2 66 x2 108 x2 88 x2 111 x2 103 x2 104 x2 131 x2 105 x2 130 x2 102 x2 105 x2 148 x2 98 x2 100 x2 128 x2 110 x2 101 x2 121 x2 127 x2 103 x2 67 x2 78 x2 71 x2 81 x2 77

價格(y1) y1 460 y1 425 y1 515 y1 580 y1 630 y1 600 y1 425 y1 439 y1 435 y1 608 y1 460 y1 460 y1 410 y1 380 y1 340 y1 520 y1 685 y1 680 y1 630 y1 328 y1 532 y1 405 y1 495 y1 470 y1 480 y1 690 y1 480 y1 690 y1 462 y1 495 y1 540 y1 440 y1 510 y1 599 y1 395 y1 450 y1 455 y1 595 y1 403 y1 295 y1 315 y1 345 y1 355 y1 335

4 房價大數(shù)據(jù)分析模型機器學(xué)習(xí)算法

機器學(xué)習(xí)首先要設(shè)計機器學(xué)習(xí)學(xué)習(xí)算法,設(shè)計機器學(xué)習(xí)學(xué)習(xí)路徑,機器學(xué)習(xí)解決的問題通常可分為預(yù)測和分類兩類問題。首先我們分析一下要解決的問題是屬于預(yù)測問題還是分類問題,然后選擇相應(yīng)的學(xué)習(xí)算法,設(shè)計學(xué)習(xí)路徑,通過訓(xùn)練數(shù)據(jù)訓(xùn)練和機器學(xué)習(xí)構(gòu)建大數(shù)據(jù)分析模型。模型通過訓(xùn)練數(shù)據(jù)訓(xùn)練出來以后,對模型進行檢驗,然后不斷進行優(yōu)化,以達到我們所期望的精度。

以下是梯度下降機器學(xué)習(xí)算法和學(xué)習(xí)路徑:

首先建立一個估值函數(shù)(模型)如下:

x為自變量(特征參數(shù)),h(x)為應(yīng)變量(房價的估值),希望求出此函數(shù)的系數(shù)θ0、θ1,構(gòu)成一個完整的函數(shù),此函數(shù)就是我們要構(gòu)建的大數(shù)據(jù)分析模型。

我們建立一個成本函數(shù),希望預(yù)測值與真實值的差趨近于0,也就是成本函數(shù)值趨近于0。

J(0, 1)=

其中:

X(I)表示向量X中的第i個元素;

Y(I)表示向量Y中的第i個元素;

表示已知的假設(shè)函數(shù);

m為訓(xùn)練集的數(shù)量;

Gradient Descent梯度下降方法機器學(xué)習(xí)步驟:

(1)先隨機選定一個初始點;

(2)確定梯度下降方向;

(3)通過實驗確定下降步伐,學(xué)習(xí)率Learning rate;

(4)通過不斷地遞歸,收斂到極小值;

通過梯度下降法使成本函數(shù)趨于0,在此條件下求得自變量的系數(shù)θ0和θ1,將此θ0和θ1帶入到函數(shù)中得到我們要的模型。

下面是介紹如何運用梯度下降法,經(jīng)過反復(fù)迭代求出θ0和θ1:

梯度下降是通過不停的迭代,最后沿梯度下降到最低點,收斂到一個我們滿意的數(shù)據(jù),誤差趨近于0時迭代結(jié)束,此時的θ0和θ1正是我們要求的函數(shù)自變量的系數(shù),有了θ0和θ1,這個假設(shè)的函數(shù)就建立起來了,這個函數(shù)就是我們要建的大數(shù)據(jù)分析模型。

梯度下降法分為批量梯度下降法和隨機梯度下降法,批量梯度下降法速度較慢,每次迭代都要所有訓(xùn)練數(shù)據(jù)參與;隨機梯度下降精度差一些,容易在極值周圍震蕩;房價大數(shù)據(jù)分析模型采用的是實時數(shù)據(jù)梯度下降法(Real Time Online Gradient Descent),可以隨著房價的變化隨時修正模型的參數(shù)。

5 構(gòu)建房價大數(shù)據(jù)分析模型

通過數(shù)據(jù)可視化,我們可以看到房價數(shù)據(jù)趨于線性,所以我們采用線性回歸構(gòu)建房價大數(shù)據(jù)分析模型。采用監(jiān)督學(xué)習(xí),先給定一個訓(xùn)練集,根據(jù)這個訓(xùn)練集學(xué)習(xí)出一個線性函數(shù),然后檢驗這個函數(shù)訓(xùn)練的好壞,即此函數(shù)是否足夠擬合訓(xùn)練集數(shù)據(jù),不斷優(yōu)化模型減少殘差,最大限度地接近真實值。

假設(shè)房價大數(shù)據(jù)分析模型:

y=aX1+bX2

通過梯度下降法,不斷遞歸,最后使假設(shè)值與實際值之差趨近于0,求得此時的模型變量系數(shù)a、b,構(gòu)建線性函數(shù)(房價大數(shù)據(jù)分析模型)。模型通過回歸診斷、交叉驗證不斷進行優(yōu)化,直到誤差達到要求。

以下是采用機器學(xué)習(xí)算法構(gòu)建的房價大數(shù)據(jù)分析模型,用R語言編寫房價大數(shù)據(jù)分析模型程序如下:

令:a=q1;b=q2;

將訓(xùn)練數(shù)據(jù)以數(shù)據(jù)框的形式存儲。

pricedata

x1

x2

y

造梯度下降算法函數(shù),初始點q1=0、q2=0;下降速率d=0.0001。

grd2

q1=0;

q2=0;

d=0.0001;

i=0;

m=9;

plot(y~x1+x2,data=pricedata,pch=16,col='red');

通過反復(fù)迭代得出估值函數(shù)系數(shù)q1、q2。

while (i

{

i=i+1;

q1=q1-d/m*(q1*x1+q2*x2-y)*x1;

q2=q2-d/m*(q1*x1+q2*x2-y)*x2;

}

return(q1);

return(q2);

}

grd2();

model2

summary(model2);

通過summary(model2)匯總出模型變量系數(shù)。

篇3

關(guān)鍵詞:數(shù)據(jù)分析應(yīng)用率;分析應(yīng)用點;四個層次;數(shù)據(jù)中心;儀表盤

中圖分類號:N37 文獻標(biāo)識碼:B 文章編號:1009-9166(2009)02(c)-0063-02

現(xiàn)代企業(yè)的決策往往是在整合大量信息資料的基礎(chǔ)上制定出來的,對數(shù)據(jù)的理解和應(yīng)用將是企業(yè)決策的基石。與傳統(tǒng)的操作型應(yīng)用相比,數(shù)據(jù)利用的應(yīng)用建設(shè)難度更大,它是隨著管理水平而發(fā)展,同時又取決于業(yè)務(wù)人員的主觀意識,這就決定了以數(shù)據(jù)利用為核心的應(yīng)用建設(shè)不可能一蹴而就,而是一個長期迭展的建設(shè)過程。從2003年起工廠開始全面推進數(shù)據(jù)分析應(yīng)用工作,經(jīng)歷過曲折,同時也有收獲。經(jīng)過多年的努力,工廠的數(shù)據(jù)分析應(yīng)用工作開始進入良性發(fā)展階段,筆者認為有必要對工廠目前數(shù)據(jù)分析應(yīng)用工作作一總結(jié)和思考。

一、工廠數(shù)據(jù)分析應(yīng)用工作開展現(xiàn)狀

工廠數(shù)據(jù)分析應(yīng)用工作推進至今已有四五年的時間,從最初全面調(diào)研工廠數(shù)據(jù)量和數(shù)據(jù)分析應(yīng)用狀況,將數(shù)據(jù)分析應(yīng)用率指標(biāo)作為方針目標(biāo)定量指標(biāo)來考核,到后來將數(shù)據(jù)分析應(yīng)用工作的推進重心從量向質(zhì)轉(zhuǎn)移,采用以項目為載體進行管理,著重體現(xiàn)數(shù)據(jù)分析應(yīng)用的實效性,再到目前以分析應(yīng)用的需求為導(dǎo)向,以分析應(yīng)用點為載體,分層次進行策劃。經(jīng)過上述三個階段,工廠數(shù)據(jù)分析應(yīng)用工作推進機制得到了逐步的完善,形成了廣度深度協(xié)同發(fā)展的信息資源利用管理框架。截止到目前,工廠數(shù)據(jù)分析應(yīng)用率達到96%,四個層次的分析應(yīng)用點共計100多個,數(shù)據(jù)分析應(yīng)用工作在生產(chǎn)、質(zhì)量、成本、物耗、能源等條線得到廣泛開展,有效推動了工廠管理數(shù)字化和精細化。2007年,工廠開始探索細化四個應(yīng)用層次的推進脈絡(luò),進一步豐富工廠信息資源利用框架,形成層次清晰、脈絡(luò)鮮明、職責(zé)分明的信息資源利用立體化的推進思路。

1、第一層次現(xiàn)場監(jiān)控層。第一層次現(xiàn)場監(jiān)控層,應(yīng)用主體是一線工人和三班管理干部,應(yīng)用對象是生產(chǎn)過程實時數(shù)據(jù),應(yīng)用目標(biāo)是通過加強生產(chǎn)過程控制,輔助一線及時發(fā)現(xiàn)生產(chǎn)過程中的異常情況,提高生產(chǎn)穩(wěn)定性。例如制絲車間摻配工段的生產(chǎn)報警,通過對生產(chǎn)過程中葉絲配比、膨絲配比、梗絲配比、薄片配比、加香配比等信息進行判異操作,對異常情況通過語音報警方式提醒擋車工進行異常處理;例如卷包車間通過在機臺電腦上對各生產(chǎn)機組的工藝、設(shè)備參數(shù)、實時產(chǎn)量、質(zhì)量、損耗數(shù)據(jù)的監(jiān)控,提高對產(chǎn)品質(zhì)量的過程控制能力。第一層次應(yīng)用以上位機和機臺電腦上固化的監(jiān)控模型為主,制絲車間每個工序、卷包車間每種機型的應(yīng)用點都有所不同,為此我們建立了制絲車間以工序為脈絡(luò),卷包車間以機種為脈絡(luò)的應(yīng)用點列表,圍繞脈絡(luò)對第一層次應(yīng)用點進行梳理,形成第一層次應(yīng)用的規(guī)范化模板。制絲車間第一層次應(yīng)用點模板包括工序名稱、應(yīng)用點名稱、應(yīng)用模型描述、應(yīng)用對象、應(yīng)用平臺、異常處置路徑等基本要素。卷包車間應(yīng)用點模板橫向根據(jù)機種分,縱向按上班及交接班、上班生產(chǎn)過程中、下班及交接班三個時間段分,通過調(diào)研分別列出擋車工針對每個機種在三個時間段分別要查看的數(shù)據(jù)和進行的操作。隨著模板的擴充和完善,一線職工的知識、經(jīng)驗不斷充實其中,第一層次應(yīng)用點模板將成為一線工人和三班管理干部日常應(yīng)用監(jiān)控的標(biāo)準(zhǔn),同時可以規(guī)避人員退休或調(diào)動帶來的經(jīng)驗、知識流失的風(fēng)險。2、第二層次日常管理分析層。第二層次日常管理分析層,應(yīng)用主體是一般管理干部,應(yīng)用對象是產(chǎn)質(zhì)損、設(shè)備、動能等指標(biāo),應(yīng)用目標(biāo)是通過加強對各類考核指標(biāo)的監(jiān)控和分析,提高工廠整體的關(guān)鍵績效指標(biāo)水平。例如制絲車間的劣質(zhì)成本數(shù)據(jù)匯總和分析,通過對車間內(nèi)各類廢物料、劣質(zhì)成本的數(shù)據(jù)進行匯總、對比和分析,尋找其中規(guī)律及薄弱環(huán)節(jié),并尋根溯源,采取措施,降低劣質(zhì)成本。例如卷包車間的產(chǎn)量分析,通過對產(chǎn)量數(shù)據(jù)、工作日安排、計劃產(chǎn)量進行統(tǒng)計和匯總,結(jié)合車間定額計劃、作業(yè)計劃和實際產(chǎn)量進行分析,尋找實際生產(chǎn)情況與計劃間的差異,并分析原因。第二層次應(yīng)用以管理人員個性化的分析為主,呈現(xiàn)出分析方法多樣化、應(yīng)用工具多樣化的特點。但是萬變不離其中的是每個管理崗位的管理目標(biāo)以及圍繞管理目標(biāo)開展的分析應(yīng)用是相對固定的,至少在短期內(nèi)不會有太大的變化。為此我們建立了一份以重點崗位為脈絡(luò)的應(yīng)用點列表,圍繞脈絡(luò)對第二層次應(yīng)用點進行梳理,形成第二層次應(yīng)用的規(guī)范化模板。模板包括崗位名稱、管理目標(biāo)、應(yīng)用點名稱、應(yīng)用描述、涉及主要考核指標(biāo)、應(yīng)用平臺、應(yīng)用頻次、分析去向等基本要素。通過構(gòu)建第二層次應(yīng)用點模板,明確了每個管理崗位應(yīng)用信息資源支撐管理目標(biāo)的內(nèi)容和職責(zé)。隨著新的管理目標(biāo)的不斷提出以及應(yīng)用的逐步深入,模板每年都會有更新和擴充。3、第三層次針對性分析應(yīng)用層。第三層次針對性分析應(yīng)用層,應(yīng)用主體是項目實施者,應(yīng)用對象是各類項目的實施過程,例如QC項目、六西格瑪項目、質(zhì)量改進項目,或針對生產(chǎn)中的特定事件進行的分析和研究。應(yīng)用目標(biāo)是通過應(yīng)用數(shù)據(jù)資源和統(tǒng)計方法開展現(xiàn)狀調(diào)查、因果分析、效果驗證等工作,提高各類項目實施的嚴(yán)密性和科學(xué)性。第三層次的應(yīng)用工具在使用初級統(tǒng)計方法的基礎(chǔ)上會大量應(yīng)用包括方差分析、回歸分析、正交試驗、假設(shè)檢驗、流程圖等在內(nèi)的中級統(tǒng)計方法。以QC活動為例,我們可以看出其實施過程無一不與數(shù)據(jù)應(yīng)用之間有密切的聯(lián)系[1]。近年來,在質(zhì)量改進項目和QC項目的評審工作中已逐步將“應(yīng)用數(shù)據(jù)說話、運用用正確合理的統(tǒng)計方法,提高解決問題的科學(xué)性”作為項目質(zhì)量考核標(biāo)準(zhǔn)之一。而六西格瑪項目實施的核心思想更是強調(diào)“以數(shù)據(jù)和事實驅(qū)動管理”,其五個階段[2]D(定義)、M(測量)、A(分析)、I(改善)、C(控制),每個階段都要求結(jié)合如FMEA(失效模式后果分析),SPC(統(tǒng)計流程控制),MSA(測量系統(tǒng)分析),ANOVE(方差分析),DOE(實驗設(shè)計)等統(tǒng)計方法和統(tǒng)計工具的應(yīng)用。4、第四層次主題性應(yīng)用層。第四層次主題性應(yīng)用層,應(yīng)用主體是中層管理者,應(yīng)用對象是專業(yè)性或綜合性的分析主題,應(yīng)用目標(biāo)是通過專業(yè)科室設(shè)計的專題性分析模型或綜合性分析模型,為中層管理層提供決策依據(jù)。工廠在實施了業(yè)務(wù)流程“自動化”之后,產(chǎn)生了大量的數(shù)據(jù)和報表。如何將工廠的業(yè)務(wù)信息及時、精煉、明確地陳述給中層管理層,以此來正確地判斷工廠的生產(chǎn)經(jīng)營狀況,是擺在我們眼前的一個突出問題。大家都有開車的經(jīng)驗,司機在駕駛車輛的時候,他所掌握的車況基本上是來自汽車的儀表盤,在車輛行使的過程中,儀表盤指針的變化,告知汽車的車速、油料、水溫等的狀況,駕駛員只要有效地控制這些指標(biāo)在安全范圍之內(nèi),車子就能正常地運行。我們不妨將儀表盤的理念移植于工廠,建立工廠關(guān)鍵指標(biāo)及運行管理儀表盤,將工廠的關(guān)鍵信息直觀地列在上面,及時提醒各級管理人員工廠生產(chǎn)運營是否正常。

⑴關(guān)鍵績效指標(biāo)監(jiān)控系統(tǒng)。對分布在各處的當(dāng)前及歷史數(shù)據(jù)進行統(tǒng)一展示,以工廠關(guān)鍵績效指標(biāo)為中心,支持統(tǒng)計分析和挖掘,可為中層管理者提供工廠關(guān)鍵績效指標(biāo)一門式的查詢服務(wù),使各業(yè)務(wù)部門尋找、闡釋問題產(chǎn)生的原因,以有效監(jiān)控各類關(guān)鍵績效指標(biāo),及時采取改進措施,提高生產(chǎn)經(jīng)營目標(biāo)完成質(zhì)量。⑵系統(tǒng)運行狀態(tài)監(jiān)控系統(tǒng)。通過數(shù)據(jù)采集、手工錄入等各種渠道收集各類系統(tǒng)的運行狀態(tài),及時掌握故障情況,采取措施加以閉環(huán),將因系統(tǒng)故障造成對用戶的影響減至最小,確保各類系統(tǒng)的穩(wěn)定運行和有效應(yīng)用。通過建立系統(tǒng)運行狀態(tài)監(jiān)控系統(tǒng),中層管理人員上班一打開電腦進入系統(tǒng),就能了解到當(dāng)天及上一天各類系統(tǒng)的運轉(zhuǎn)情況,發(fā)生了什么異常,哪些故障已經(jīng)得到解決,哪些故障還未解決。⑶第四層次主題性分析應(yīng)用。在展示關(guān)鍵績效指標(biāo)和系統(tǒng)運行狀態(tài)的基礎(chǔ)上,由各專業(yè)科室思考專業(yè)條線上的分析主題,采用先進科學(xué)的理念和方法對數(shù)據(jù)進行分析和挖掘。近兩年來,工廠充分發(fā)揮專業(yè)科室的優(yōu)勢和力量,相繼設(shè)計和開發(fā)了工藝質(zhì)量條線的六西格瑪測評系統(tǒng),設(shè)備條線的設(shè)備效能分析系統(tǒng),還有質(zhì)量成本核算與分析系統(tǒng)。通過這些分析主題的支持,工廠管理人員可以更方便快捷地了解質(zhì)量、設(shè)備、成本等條線上的關(guān)鍵信息,及時采取相應(yīng)措施,從而提升管理效率。

二、數(shù)據(jù)分析應(yīng)用工作存在的不足及思考

工廠數(shù)據(jù)分析應(yīng)用工作的推進方法從最初的采用數(shù)據(jù)分析應(yīng)用率單個指標(biāo)進行推進發(fā)展到目前按上文所述的四個層次進行推進,每個層次的推進脈絡(luò)已經(jīng)逐步清晰和明朗,但事物發(fā)展到一定的階段總會達到一個瓶頸口,目前工廠數(shù)據(jù)分析應(yīng)用工作存在的問題及措施思考如下:

1、從推進手段上要突破信息條線,充分發(fā)揮專業(yè)條線的力量。信息條線作為推進工廠數(shù)據(jù)分析應(yīng)用的主管條線,其作用往往局限在技術(shù)層面上的支撐。雖然信息條線每年都會規(guī)劃形成工廠數(shù)據(jù)分析應(yīng)用整體的工作思路和具體的實施計劃,但是無論從工廠層面還是從車間層面來講,單純依靠信息條線從側(cè)面加以引導(dǎo)和推進,使得數(shù)據(jù)分析應(yīng)用工作始終在業(yè)務(wù)條線的邊緣徘徊,與產(chǎn)量、質(zhì)量、設(shè)備、消耗、成本、動能等各個條線本身工作的結(jié)合度有一定的距離。所以工廠要進一步推進數(shù)據(jù)分析應(yīng)用工作,調(diào)動起業(yè)務(wù)人員的積極性和主動性,突破現(xiàn)有的瓶頸,應(yīng)該考慮如何調(diào)動起專業(yè)條線的力量。一是可以在年初策劃應(yīng)用點的時候要加強專業(yè)條線對車間業(yè)務(wù)自上而下的指導(dǎo),引導(dǎo)管理人員加強對缺少數(shù)據(jù)分析支撐的工序、崗位/管理目標(biāo)的思考;二是建立平臺加強各車間同性質(zhì)崗位之間的溝通與交流,均衡各個車間的數(shù)據(jù)分析應(yīng)用水平和能力;三是對車間提交的分析報告給出專業(yè)性的指導(dǎo)意見。2、要加強對數(shù)據(jù)中心的應(yīng)用。數(shù)據(jù)中心的建立可以使業(yè)務(wù)系統(tǒng)從報表制作、數(shù)據(jù)導(dǎo)出等功能中解放出來,專注于事務(wù)處理,將數(shù)據(jù)應(yīng)用方面的功能完全交給數(shù)據(jù)中心來解決。目前,數(shù)據(jù)中心已建立了涉及產(chǎn)量、質(zhì)量、消耗等各個條線的Universe模型,并對全廠管理干部進行了普及性的培訓(xùn)。但是從目前應(yīng)用情況來看,還比較局限于個別管理人員,追尋原因如下:一是業(yè)務(wù)系統(tǒng)開發(fā)根據(jù)用戶需求定制開發(fā)報表,業(yè)務(wù)人員通常習(xí)慣于從現(xiàn)成的報表中獲取信息。如果要求業(yè)務(wù)人員使用數(shù)據(jù)中心工具自行制作報表模板,甚至可能需要將其導(dǎo)出再作二次處理,那么業(yè)務(wù)人員一定更傾向于選擇第一種方式。二是近幾年來人員更替較多,新進管理人員不熟悉數(shù)據(jù)中心應(yīng)用,導(dǎo)致數(shù)據(jù)中心應(yīng)用面受到限制。隨著今后MES的建設(shè),業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)、報表、臺帳和分析功能將有可能由業(yè)務(wù)用戶自行通過集成在MES中的數(shù)據(jù)中心前端開發(fā)工具來訪問和靈活定制。因此,要盡快培養(yǎng)工廠業(yè)務(wù)人員數(shù)據(jù)中心的應(yīng)用能力,包括數(shù)據(jù)獲取以及報表定制方面的技能。筆者認為應(yīng)對方法如下:一是對于崗位人員變更做好新老人員之間一傳一的交接和培訓(xùn);二是適時針對新進管理人員開展集中培訓(xùn);三是通過采用一定的考核方法。3、提高新增應(yīng)用點的質(zhì)量。工廠每年都會組織各部門審視第一、第二層次應(yīng)用點列表,圍繞重點工序和重點管理崗位調(diào)研有哪些應(yīng)用上的空白點是需要重點思考的,以新增分析應(yīng)用點的方式進行申報和實施。同時針對第三層次針對性分析應(yīng)用,工廠也會要求部門以新增分析應(yīng)用點的方式將需要數(shù)據(jù)支撐的項目進行申報。作為一項常規(guī)性工作,工廠每年都會組織部門進行應(yīng)用點的申報,并按項目管理的思想和方法實施,事先確立各個應(yīng)用點的應(yīng)用層次、數(shù)據(jù)獲取方式、實現(xiàn)平臺,并對其實施計劃進行事先的思考和分解,確定每一個階段的活動目標(biāo)、時間節(jié)點以及負責(zé)人員,每個季度對實施情況予以總結(jié),并動態(tài)更新下一階段的實施計劃。該項工作從2005年起已經(jīng)連續(xù)開展了三年,部門可供挖掘的應(yīng)用點越來越少,如何調(diào)動部門的積極性,保持并提高應(yīng)用點的實效性,我們有必要對新增分析應(yīng)用點的質(zhì)量和實施情況進行考評,考評標(biāo)準(zhǔn)為:一是新增分析應(yīng)用點是否能體現(xiàn)數(shù)據(jù)應(yīng)用開展的進取性、開拓性和創(chuàng)新性;二是新增分析應(yīng)用點是否能切實提高管理的精細化和科學(xué)化水平;三是新增分析應(yīng)用點是否能采用項目管理的思想和方法實施,按時間節(jié)點完成各項預(yù)定計劃。

三、結(jié)束語。隨著近幾年來技術(shù)平臺的相繼成熟以及管理手段的逐步推進,工廠業(yè)務(wù)人員用數(shù)據(jù)說話的意識已經(jīng)越來越強,但是要真正使工廠管理達到“三分技術(shù)、七分管理、十二分?jǐn)?shù)據(jù)”的水平,還有很長的路要走,這既需要我們的業(yè)務(wù)人員從自身出發(fā)提高應(yīng)用數(shù)據(jù)的水平和能力,同時也需要工廠從管理手段和管理方法上不斷拓寬思路、創(chuàng)新手段,真正實現(xiàn)數(shù)據(jù)分析應(yīng)用成為工廠管理的重要支撐手段。

作者單位:上海卷煙廠

參考文獻:

篇4

【關(guān)鍵詞】土工實驗;實驗數(shù)據(jù);數(shù)據(jù)分析;分析方法

一、引言

在進行實驗過程中,由于土體本身所具有的復(fù)雜性,土質(zhì)質(zhì)檢所存在的物理學(xué)特性以及采樣、運輸、存儲等等方面所表現(xiàn)出來的特點,都容易對數(shù)據(jù)造成一定程度的干擾,致使實驗的結(jié)果出現(xiàn)誤差。另外,因為實驗本身受到很多因素的干擾,也同樣容易發(fā)生數(shù)據(jù)偏差的問題。因此,本文著重從實驗數(shù)據(jù)所涉及的內(nèi)容,影響實驗數(shù)據(jù)的因素,以及提升實驗準(zhǔn)確率的角度出發(fā),對土工實驗數(shù)據(jù)分析方法進行探討。

二、土工試驗數(shù)據(jù)所涉及內(nèi)容

(一)土的比重實驗。土工試驗過程中,土的比重實驗是非常重要的。一般來說,地域相同或者相近,那么土的比重也將會比較相近。但是,因為在實際操作中,其整個的操作流程比較復(fù)雜,所以不同的單位會采用本地所出具的或者考察的相關(guān)數(shù)據(jù)直接進行比重實驗,這樣容易導(dǎo)致實驗數(shù)據(jù)的誤差存在。

(二)土的密度實驗。通過土的密度實驗可以詳細的了解土的組成,可以了解其組成成分的性質(zhì),能夠為之后的施工提供更多的參考。土的密度與土粒的重量、孔隙體積、孔隙大小、孔隙水重等等內(nèi)容息息相關(guān),能夠反映土的組成和基本結(jié)構(gòu)特征。在進行實驗的過程中,要注意盡量避免對取樣即時進行實驗,最好能夠等待土樣達到日常狀態(tài)之后再進行試驗,這樣可以讓土密度實驗的結(jié)果更加準(zhǔn)確。

(三)土的含水量實驗。土的含水量實驗可以說是土工實驗中的核心內(nèi)容,其實驗的情況將會影響到工程地基建設(shè),還會影響到后續(xù)工程的穩(wěn)定性。不同地區(qū)的土樣其含水量不同,并存在很大程度上的差異性。實驗人員在進行取樣的過程中,要保證其樣品的均勻性,或者具有代表性,否則進行試驗所獲得的數(shù)據(jù)就沒有任何指導(dǎo)意義,其數(shù)據(jù)在實踐應(yīng)用中的效率和質(zhì)量也將會呈現(xiàn)大幅度的下降。

三、土性參數(shù)實驗結(jié)果誤差性的原因

(一)土體本身性質(zhì)導(dǎo)致。依照相關(guān)的物理力學(xué)和力學(xué)性質(zhì),我們可以了解到土體的分層具有不均勻性,加上其所處環(huán)境的變化,可能發(fā)生的雨水沖擊、水文變化、其后影響等等語速怒,都會讓土體的性質(zhì)發(fā)生改變。這樣在進行土工試驗的時候就非常容易造成實驗結(jié)果的差異性,甚至有可能會成為差異產(chǎn)生的主要影響因素。

(二)系統(tǒng)誤差。系統(tǒng)誤差是由于儀器的某些不完善、測量技術(shù)上受到限制或?qū)嶒灧椒ú粔蛲晟茮]有保證正確的實驗條件等原因產(chǎn)生。不同的單位所使用的儀器往往不盡相同,所使用的試驗方法也有一定的出入,加上不同的試驗方法讓土工參數(shù)出現(xiàn)離散性,其所實驗的數(shù)據(jù)也就會有所不同。系統(tǒng)誤差的存在可以予以避免,其與偶然誤差不同,這就需要實驗室對設(shè)備和系統(tǒng)進行改進。

(三)偶然誤差。偶然誤差的特點是它的隨機性。如果實驗人員對某物理量只進行一次測量,其值可能比真值大也可能比真值小,這完全是偶然的,產(chǎn)生偶然誤差的原因無法控制,所以偶然誤差總是存在,通過多次測量取平均值可以減小偶然誤差,但無法消除。偶然誤差的存在屬于客觀存在的現(xiàn)象,其與人為原因所造成的誤差有很大的差別,對于兩者應(yīng)當(dāng)予以區(qū)分。

四、土工實驗數(shù)據(jù)分析方法的應(yīng)用

(一)進行數(shù)據(jù)檢查,果斷進行取舍。在進行實驗的過程中,如果有明顯不符合物理力學(xué)性質(zhì)的值的范圍點,則可以通過觀察予以了解,實驗人員要對其進行細致觀察,一旦發(fā)現(xiàn)異常立刻予以放棄。一般判斷的標(biāo)準(zhǔn)是大部分?jǐn)?shù)值為范圍內(nèi)波動,但是有一點超出正常值或者距離正常值較遠,則可以被認定為不合理。在實驗數(shù)據(jù)較多的情況下可以運用3σ法則進行數(shù)據(jù)之間取舍的考量。在進行實驗過程中,存在于之外數(shù)值所占比例較少,因此,大于和小于之間數(shù)值作為異常處理。

(二)土工實驗數(shù)據(jù)中最小樣本數(shù)問題。在土工試驗過程中,最小樣本數(shù)問題需要引起人們的重視。實驗中的樣本數(shù)要選取適當(dāng),如果樣本數(shù)過小就會影響實驗結(jié)果的準(zhǔn)確性。但是,樣本數(shù)的數(shù)量并不是隨意定制的,其受到多種因素的影響,比如工程規(guī)模、工程精度要求、現(xiàn)場勘查情況等等。

(三)土體性質(zhì)指標(biāo)的自相關(guān)性的問題。根據(jù)以往數(shù)據(jù)實驗的關(guān)聯(lián)性,求的往往是其之間的線性相關(guān)系數(shù),但是對于其自相關(guān)函數(shù)通常并沒有表現(xiàn)出線性相關(guān),而是指數(shù)相關(guān)。因此,不能簡單依照求相關(guān)系數(shù)的方法判斷其相關(guān)性。在進行土工實踐過程中,往往可以通過δ對其獨立性進行判斷。在相關(guān)距離 范圍內(nèi),圖形指標(biāo)基本相關(guān);在此范圍外,圖形指標(biāo)基本不相關(guān)。但是對于δ事先未知,因此其需要根據(jù)樣本測值進行求算,一般使用遞推平均法對相關(guān)距離δ進行計算,并使用間距Z對δ的影響進行綜合考量。一般來說,Z /δ的數(shù)值越大,其各抽樣點的土性越接近相互獨立,抽樣誤差也就越小。

五、結(jié)束語

土工試驗對于土工建設(shè)來說影響較大,其影響因素包括土體本身性質(zhì)、取樣儀器情況、人為因素等,需要對此方面予以重視。對其不合理點來說,可以通過3 原則進行剔除。對于其數(shù)據(jù)相關(guān)性來說,其可以通過迭代求解土性指標(biāo)相關(guān)距離予以解決,通過樣本的加權(quán)平均來對該區(qū)域的平均性指標(biāo)進行估算。為了讓樣本能夠滿足實驗需要,可以利用Bayes方法對其土性指標(biāo)與因確認,從而彌補數(shù)目不準(zhǔn)確的情況。通過此三個方面對其進行方法的應(yīng)用,則可以有效提升實驗數(shù)據(jù)的準(zhǔn)確性、可靠性,可以讓實驗的結(jié)果更加符合實際需要。

參考文獻

[1]余海龍,張利宇. 土工實驗數(shù)據(jù)分析方法探討[J].中國新技術(shù)新產(chǎn)品,2015,21:132-133.

[2]劉松玉,蔡正銀. 土工測試技術(shù)發(fā)展綜述[J].土木工程學(xué)報,2012,03:151-165.

篇5

關(guān)鍵詞:大數(shù)據(jù);分析模型;檢驗方法

中圖分類號:G712 文獻標(biāo)志碼:A 文章編號:1674-9324(2017)17-0082-02

一、引言

房價大數(shù)據(jù)分析模型通過機器學(xué)習(xí)方法構(gòu)建,模型建立完成后需要對模型進行檢驗,房價大數(shù)據(jù)模型需要檢驗擬合的情況,欠擬合說明模型對數(shù)據(jù)的覆蓋程度不夠,過擬合無法反應(yīng)模型的通用性。通過回歸診斷,診斷殘差情況,殘差是反映真實值與假設(shè)值之間的差,希望模型殘差盡量小,假設(shè)值極大地逼近真實值。通過檢驗可以剔除奇異數(shù),剔除一些干擾項。

二、回歸診斷

1.房價大數(shù)據(jù)分析模型。price1

Residuals:

Min 1Q Median 3Q Max

-7.5556 -2.6667 -0.2222 3.5556 8.6667

殘差最小是-7.5556,最大是8.6667,中值是-0.2222。估計的值與真實值存在一定的誤差,通過求極值算法使之最小。

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.7778 5.7061 7.672 0.000256 ***

size 1.5111 0.2461 6.140 0.000855 ***

room 15.7778 10.7282 1.471 0.191782

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’‘ ’ 1

Residual standard error: 5.837 on 6 degrees of freedom

Multiple R-squared: 0.9949,Adjusted R-squared: 0.9932

F-statistic:582.3 on 2 and 6 DF, p-value: 1.346e-07

2.模型參數(shù)。采用最小二乘法算法,經(jīng)過機器學(xué)習(xí),訓(xùn)練出模型參數(shù),構(gòu)成房價大數(shù)據(jù)分析模型:房價大數(shù)據(jù)分析模型為y=aX1+bX2+C,其中:X1=size(面積),X2=room(間數(shù)),y(總價)。經(jīng)過機器學(xué)習(xí)得到模型以下參數(shù):Size=1.5111;Room=15.7778;截距=

43.7778;y=1.5111*X1+15.7778*X2+43.7778,此函數(shù)為房價大數(shù)據(jù)分析模型。

3.顯著性檢驗。

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.7778 5.7061 7.672 0.000256 ***

size 1.5111 0.2461 6.140 0.000855 ***

room 15.7778 10.7282 1.471 0.191782

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’‘ ’ 1

殘差自由度為6的殘差標(biāo)準(zhǔn)誤差為5.837,p-value:1.346e-07,P值很小說明無自相關(guān)性,殘差項之間獨立。自變量與應(yīng)變量相關(guān)性,截距和size顯著性均為三顆星***,說明截距和size與Y相關(guān)性顯著;room沒有星,說明room與Y房價相關(guān)性不顯著。

4.擬合情況分析。

通過數(shù)據(jù)可視化,觀察房價大數(shù)據(jù)散點圖,可以看出房價大數(shù)據(jù)訓(xùn)練樣本呈直線分布。可以用線性回歸進行房價大數(shù)據(jù)分析模型的構(gòu)建。

通過殘差與擬合圖,觀察和分析模型對訓(xùn)練數(shù)據(jù)集擬合程度,從上圖擬合線(紅線)對數(shù)據(jù)的擬合情況看,基本上擬合了大多數(shù)數(shù)據(jù)。沒有發(fā)生欠擬合或過擬合。Multiple R-squared: 0.9949,Adjusted R-squared: 0.9932,從這兩個數(shù)據(jù)可以看出擬合達到99%以上,擬合程度很高。

5.假設(shè)性檢驗。從正態(tài)Q-Q圖上可以看出,數(shù)據(jù)分布在45°直線周圍,標(biāo)準(zhǔn)殘差成正態(tài)分布,滿足正態(tài)性假設(shè)。

6.方差檢驗。同方差性,若滿足不變方差假設(shè),位置―尺度圖縱坐標(biāo)為標(biāo)準(zhǔn)化殘差的平方根,殘差越大,點的位置越高。從圖中可以看出經(jīng)過對殘差處理為標(biāo)準(zhǔn)化殘差的平方根,擬合的總體趨勢還可以,個別點可以看出遠離擬合線如“點5”、“點7”,奇異點已經(jīng)顯露。

7.奇異數(shù)檢驗。從殘差與杠桿圖中可以看出離群點和影響強度。Cook's distance值衡量強影響點的強度,從圖中可以看出“點7”這個點Cook's distance值超過0.5是所有數(shù)據(jù)中Cook's distance值最高的數(shù)據(jù),它是目前的強影響點。杠桿值高的數(shù)據(jù)是離群點,目前“點4”杠桿值也較高,它也是離群點。

主站蜘蛛池模板: t66y最新地址一地址二69 | 国产精品亚洲视频 | 日韩视频网 | 国产精品免费视频观看 | 国产精品视频免费观看 | 欧美激情一区二区三区在线观看 | 国产精品高清在线 | 久草中文在线 | 成人在线看片 | 一级毛片视频 | 亚洲第一天堂无码专区 | 久草电影网 | 久久小视频 | 国产乱码一区二区三区在线观看 | 久久视频一区 | 一区免费看 | 日本久久久一区二区三区 | av一区二区三区四区 | 最近的中文字幕在线看视频 | 成人片免费看 | 在线观看成人国产 | 亚洲精品一二区 | 色吟av| 九色精品| 91精品国产综合久久福利软件 | 免费看黄色一级视频 | 北条麻妃一区二区三区中文字幕 | 亚洲一区成人 | 免费v片在线观看 | 亚洲欧美日韩在线一区 | 成人免费网站www网站高清 | 毛片在线看片 | 久久国产精品久久久久久 | 午夜精品视频在线观看 | 亚洲成人免费在线观看 | 国产情品 | 一区二区三区四区视频 | 久久精品无码一区二区三区 | 欧美精品一区二区三区在线 | 午夜精品久久久久久久久久久久久 | 精品免费视频 |