close

今天要來跟大家講要如何把屬於自己的nlc創造出來

 

首先你必須要上bluemix申請屬於自己的nlc服務

 

建立完服務之後

各位大大們有兩種選擇去訓練你的NLC~

 

 

第一種訓練方法

第一;給我們的nlc一份cvs檔案

使用api接口的方式將我們的csv上傳到我們服務

接著我們的服務就會自動地把你的nlc建立出來

並且給你他的nlc id

而 csv裡面的內容應該長成怎麼樣呢?

裡面必須要有

{訓練的內容,分類}

所以你的csv檔會長成以下的格式

//////////////////////////////////////////我是分隔線/////////////////////////////

白癡喔,辱罵

妳好漂亮,誇獎

你好美,誇獎

小姐不是我在說你長得真的美若天仙,誇獎

哥哥不是我在說你真的不能靠臉吃飯,羞辱

///////////////////////////////////////////////////////////////////////////////////

以上述的這個例子,nlc就會自動幫你見出一個只有3個分類的nlc

我幹嘛沒事要用這麼大的字嚇唬大家呢

其實這就代表著你的nlc會無法分出這三個類別以外的東西

所以你如果要用這個nlc對'今天的天氣如何'做分類

他也會從 誇獎 辱罵 羞辱 中硬是生了一個分類給你

所以我們在訓練nlc的時候我們連other類別都會訓練進去

什麼意思呢?

我們會將nlc的csv檔寫成以下的樣貌

//////////////////////////////////////////我是分隔線/////////////////////////////

白癡喔,辱罵

妳好漂亮,誇獎

哈哈哈哈哈,other

你好美,誇獎

小姐不是我在說你長得真的美若天仙,誇獎

天啊,other

今天新聞指出,other

哥哥不是我在說你真的不能靠臉吃飯,羞辱

///////////////////////////////////////////////////////////////////////////////////

所以他會有一個範疇是會把跟你的主題沒關的語句丟入Other當中喔

 

接著來講講第二種訓練方法

在你點入服務的時候,你會發現有一個beta工具可以使用喔~

點入之後會長這樣

 

不過各位大大的nlc會是空的

而我的因為已經訓練過好幾次,所以已經有好幾個nlc的東西了

那個為第一次使用呢,我們就直接去train data那邊新增你的資料囉~

進去之後長這樣

 

左邊代表著這個tool裡面有的class

右邊則是跟前面的csv很像的一個內容對上一個分類

大家應該發現為什麼我不是在點選一個nlc之後才選擇這些資料的呢?

因為

 

一個nlc服務裡面雖然可以同時存在10個classifier,但一個nlc tool裡面只能同時存在著一個nlc classifier的data,所以當你要訓練10個截然不同的classifier的時候,你必須要把其他的data先export成cvs檔儲存,再進行新的classifier的訓練。

 

那大家都開始來新增第一筆資料八

首先先按下add text

接著輸入

哈哈

然後在class中輸入 尷尬

並且按下done這時候就可以在右邊看到一個尷尬的class已經被增加了,並且有一筆資料

就像我的是長這樣~

在這邊必須要注意一點

每一個class 至少要有5筆資料

那新增完資料之後我們就可以按下右上角的create classifier進行你的訓練了

在這邊跟大家講一個比較尷尬的東西就是,他目前還沒有正式支援中文

但是訓練出來的classifier還是有一定的精準度,尤其是語言選擇日文的時候,精準度會增加<3

 

在等待個10到20分鐘之後就可以看到妳的classifier訓練好了~

他會跟你說你的classifier已經available

這時候點選右下角的那個箭頭,你就會進入這個classifier的驗證模式了

這邊就可以在text field裡面輸入你想要看他分類的準不準的內容並按下發送

這時候他就會幫你排出可能的class順序高低,並且給你可信度

這時候這個tool好用的地方就來了

如果你的結果並不正確的話

你可以直接點選下面正確的類別像是這樣

接著把很多新加進來並且不正確或是可信度不高的資料都點選完類別之後

按下右邊的add data

你就可以看到剛剛新家進來的data已經被排入nlc的訓練名單中了,而且連類別都幫你設定好了

接著就可以重複剛剛的訓練步驟在創建出一個更精準的classifier了

 

那順道跟大家介紹一下create 旁邊的這三個按鈕

第一個就是將csv上傳至這個tool裡面

第二個就是把現有的data下載成csv檔

第三個就是把現在tool的data全部刪光光(只有train data而已 classifier還會在)

以上~就是這次的nlc大概的介紹

下次會跟大家講解nlc以及dialog的結合方法~

arrow
arrow
    全站熱搜

    C牛(norman kung) 發表在 痞客邦 留言(0) 人氣()