摘要:k個主題時取前k列/前k行 閱讀全文
posted @ 2020-01-07 19:55 前朝明月照溝渠 閱讀 (3) 評論 (0) 編輯
摘要:目錄: 隱馬爾可夫模型 Viterbi算法(必須掌握) 簡述:普通領域不常用,自然語言與金融領域用的比較多,總共涉及到概率問題,求參數問題,取范圍問題。 用到的知識點有全概率公式,條件概率公式,邊緣概率公式,貝葉斯公式,極大似然估計 概率計算問題 直接計算法 暴力算法 前向算法 后向算法 后向算法不 閱讀全文
posted @ 2020-01-06 22:03 前朝明月照溝渠 閱讀 (7) 評論 (0) 編輯
摘要:目錄 最大似然估計 K-means算法 EM算法 GMM算法(實際是高斯混合聚類) 中心思想:①極大似然估計 ②θ=f(θold) 此算法非常老,幾乎不會問到,但思想很重要。 EM的原理推導還是蠻復雜的,圖片上沒法子編輯公式,直接打字無法完美描述整個過程,所以我直接在紙上打出詳細過程加以備注 有哪些 閱讀全文
posted @ 2020-01-04 14:30 前朝明月照溝渠 閱讀 (4) 評論 (0) 編輯
摘要:目錄: 樸素貝葉斯 貝葉斯網絡 樸素貝葉斯 特征屬性之間沒有關聯關系,相互獨立的,在此基礎上應用貝葉斯定理。 文本數據分類知識 閱讀全文
posted @ 2020-01-03 13:40 前朝明月照溝渠 閱讀 (12) 評論 (0) 編輯
摘要:目錄 梯度下降法、拉格朗日乘子法、KKT條件回顧感知器模型回顧SVM線性可分SVM線性不可分核函數SMO SVM線性可分,SVM線性不可分,核函數,要求會推導 ———————————————————————————— 學習率(步長)可以是任何數,如果是二階偏導數的話,則為牛頓法 優化問題: 給定一個 閱讀全文
posted @ 2020-01-02 22:03 前朝明月照溝渠 閱讀 (19) 評論 (0) 編輯
摘要:譜聚類是基于譜圖理論基礎上的一種聚類方法,與傳統的聚類方法相比: 具有在任意形狀的樣本空間上聚類并且收斂于全局最優解的優點。 通過對樣本數據的拉普拉斯矩陣的特征向量進行聚類,從而達到對樣本數據進行聚類的目的; 其本質是將聚類問題轉換為圖的最優劃分問題,是一種點對聚類算法。譜聚類算法將數據集中的每個對 閱讀全文
posted @ 2020-01-01 19:39 前朝明月照溝渠 閱讀 (5) 評論 (0) 編輯
摘要:原理:先設置兩個先驗值r1,r2,我把他們理解為內圈外圈,大家可以跟我學。將所有樣本放入一個列表,隨機選一個樣本拿出來作為第一個簇的簇中心點,然后從列表中剩下的所有樣本中隨機抽取一個,,計算其與簇中心點的距離。 如果大于外圈r1,則不屬于此簇,而是拿出去單獨成為一簇,并作為簇中心點,從列表中刪除此樣 閱讀全文
posted @ 2020-01-01 18:40 前朝明月照溝渠 閱讀 (3) 評論 (0) 編輯
摘要:簡單來說:鄰域就是范圍,密度就是該范圍內樣本的個數。 核心點:設定一個閾值M,如果在該鄰域內不包括某點本身,樣本的個數大于閾值M,則此點就是核心點。 對于一個數據集來說,大部分都是核心點,因為鄰域是我隨便給的嘛,不是核心點的就是非核心點。 邊界點:若此點不是核心點,但是此點的鄰域內包含一個或多個核心 閱讀全文
posted @ 2020-01-01 18:39 前朝明月照溝渠 閱讀 (5) 評論 (0) 編輯
摘要:Mini Batch K-Means算法是K-Means算法的一種優化變種,采用小規模的數據子集(每次訓練使用的數據集是在訓練算法的時候隨機抽取的數據子集)減少計算時間,同時試圖優化目標函數; Mini Batch K-Means算法可以減少K- Means算法的收斂時間,而且產生的結果效果只是略差 閱讀全文
posted @ 2020-01-01 17:30 前朝明月照溝渠 閱讀 (7) 評論 (0) 編輯
摘要:共有以下幾種評價指標: 其中,僅輪廓系數比較合理,別的不過是牽強附會罷了,就差欺世盜名了。 混淆矩陣均- -性完整性V-measure調整蘭德系數(ARI)調整互信息(AMI)輪廓系數(Silhouette) 輪廓系數: 閱讀全文
posted @ 2020-01-01 17:28 前朝明月照溝渠 閱讀 (5) 評論 (0) 韩国快乐8开奖结果查询