In [1]:
from surprise import BaselineOnly
from surprise import Dataset
from surprise import Reader
from surprise.model_selection import cross_validate
                                                                                                                            
import pandas as pd
import numpy as np
import pymongo 
from pythainlp import sent_tokenize

client = pymongo.MongoClient("mongodb://aitulib.com:27017/")
db = client["turec_db"]

In [2]:
def create_rating_pd():
    data = list(db.sim_rate.find().limit(10000))
    ratings = pd.DataFrame(data)
    ratings = ratings.drop('_id', axis=1)
    return ratings

In [3]:
ratings = create_rating_pd()
ratings

Unnamed: 0,borrowernumber,biblionumber,rating
0,3222,161503,5.0
1,3222,619849,5.0
2,3222,690445,5.0
3,3222,679121,5.0
4,174597,53551,1.0
...,...,...,...
4067,171411,378518,5.0
4068,171411,665284,5.0
4069,171411,522183,5.0
4070,171411,363720,5.0


In [4]:
pd.options.display.max_colwidth = 200
pd.options.display.max_rows = 800


In [5]:
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer

In [6]:
r_limit = 50000
books = db.book_map3.find(no_cursor_timeout=True).sort([("rating_count", -1), ("rating_avg", -1)]).limit(r_limit)
content_df = pd.DataFrame(list(books))
content_df.drop('_id', axis=1, inplace=True)
content_df = content_df.set_index('biblionumber')
content_df

  return Cursor(self, *args, **kwargs)


Unnamed: 0_level_0,title,rating_count,rating_avg,soup,ts
biblionumber,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
600363,กฎหมายวิธีพิจารณาความอาญา. เล่ม 1 / คนึง ฦาไชย.,32,3.56,วิธีพิจารณาความอาญา. 181667,2021-08-20 13:42:04
714806,Things of techno,29,3.32,,2021-08-20 16:20:58
608784,กฎหมายวิธีพิจารณาความอาญา. เล่ม 2 / คนึง ฦาไชย.,28,3.24,วิธีพิจารณาความอาญา. 181667,2021-08-20 13:39:16
696113,880-02 เซเปียนส์ : ประวัติย่อมนุษยชาติ / ยูวัล โนอาห์ แฮรารี เขียน ; นำชัย ชีววิวรรธน์ แปล.,23,2.84,880-04 อารยธรรม ประวัติ. 50617 880-05 มนุษย์ ประวัติ. 791109 880-06 ประวัติศาสตร์โลก. 34514 880-07 ลำดับเหตุการณ์ทางประวัติศาสตร์. 50416 880-08 เทคโนโลยีกับอารยธรรม ประวัติ. 791110,2021-08-20 09:04:38
664720,"880-02 การเมืองเปรียบเทียบ : ทฤษฎี แนวคิด และกรณีศึกษา = Comparative politics : theories, concepts & case studies / ไชยวัฒน์ ค้ำชู, นิธิ เนื่องจำนงค์.",22,2.76,880-05 การบริหารรัฐกิจเปรียบเทียบ. 42796,2021-08-19 09:37:04
...,...,...,...,...,...
624862,"Case studies in allergic disorders / Hans Oettgen, Raif Geha.",0,1.00,Hypersensitivity Case reports. 692734 Immune system diseases Case reports. 560570,2020-11-16 16:14:53
706373,A manga lover's Tokyo travel guide : [my favorite things to see and do in Japan!] / Evangeline Neo.,0,1.00,"Comic books, strips, etc. Japan Tokyo. 803385 Graphic novels Japan Tokyo. 803386 Animated films Japan Tokyo. 803387",2019-10-10 15:34:05
643072,"Income contingent loans : theory, practice and prospects / edited by Bruce Chapman, Timothy Higgins and Joseph E. Stiglitz.",0,1.00,"Income-contingent loans 716280 Congresses. Student loans 716281 Congresses. Education, Higher Finance Congresses. 716282",2020-10-20 11:50:56
643007,The ethics of researching war : looking for Bosnia / Elizabeth Dauphinée.,0,1.00,"Yugoslav War, 1991-1995. 73513 War Moral and ethical aspects. 324523 War Fieldwork Moral and ethical aspects. 716148 Research Moral and ethical aspects. 345502",2018-11-30 16:41:46


In [7]:
def create_soup(x):
    temp = x['title'] + " " + x['soup']
    l = sent_tokenize(temp, engine="whitespace+newline")
    return " ".join(l)

In [8]:
content_df['soup_final'] = content_df.apply(create_soup, axis=1)
count_vector = CountVectorizer(stop_words='english')
count_matrix = count_vector.fit_transform(content_df[:r_limit]['soup_final'])

content_df.head(100)

Unnamed: 0_level_0,title,rating_count,rating_avg,soup,ts,soup_final
biblionumber,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
600363,กฎหมายวิธีพิจารณาความอาญา. เล่ม 1 / คนึง ฦาไชย.,32,3.56,วิธีพิจารณาความอาญา. 181667,2021-08-20 13:42:04,กฎหมายวิธีพิจารณาความอาญา. เล่ม 1 / คนึง ฦาไชย. วิธีพิจารณาความอาญา. 181667
714806,Things of techno,29,3.32,,2021-08-20 16:20:58,Things of techno
608784,กฎหมายวิธีพิจารณาความอาญา. เล่ม 2 / คนึง ฦาไชย.,28,3.24,วิธีพิจารณาความอาญา. 181667,2021-08-20 13:39:16,กฎหมายวิธีพิจารณาความอาญา. เล่ม 2 / คนึง ฦาไชย. วิธีพิจารณาความอาญา. 181667
696113,880-02 เซเปียนส์ : ประวัติย่อมนุษยชาติ / ยูวัล โนอาห์ แฮรารี เขียน ; นำชัย ชีววิวรรธน์ แปล.,23,2.84,880-04 อารยธรรม ประวัติ. 50617 880-05 มนุษย์ ประวัติ. 791109 880-06 ประวัติศาสตร์โลก. 34514 880-07 ลำดับเหตุการณ์ทางประวัติศาสตร์. 50416 880-08 เทคโนโลยีกับอารยธรรม ประวัติ. 791110,2021-08-20 09:04:38,880-02 เซเปียนส์ : ประวัติย่อมนุษยชาติ / ยูวัล โนอาห์ แฮรารี เขียน ; นำชัย ชีววิวรรธน์ แปล. 880-04 อารยธรรม ประวัติ. 50617 880-05 มนุษย์ ประวัติ. 791109 880-06 ประวัติศาสตร์โลก. 34514 880-07 ลำดับ...
664720,"880-02 การเมืองเปรียบเทียบ : ทฤษฎี แนวคิด และกรณีศึกษา = Comparative politics : theories, concepts & case studies / ไชยวัฒน์ ค้ำชู, นิธิ เนื่องจำนงค์.",22,2.76,880-05 การบริหารรัฐกิจเปรียบเทียบ. 42796,2021-08-19 09:37:04,"880-02 การเมืองเปรียบเทียบ : ทฤษฎี แนวคิด และกรณีศึกษา = Comparative politics : theories, concepts & case studies / ไชยวัฒน์ ค้ำชู, นิธิ เนื่องจำนงค์. 880-05 การบริหารรัฐกิจเปรียบเทียบ. 42796"
696854,"880-02 คำอธิบายประมวลกฎหมายแพ่งและพาณิชย์ เรียงมาตรา ว่าด้วยจัดการงานนอกสั่ง ลาภมิควรได้ ละเมิด บรรพ 2 มาตรา 395-452 / จิตติ ติงศภัทิย์ ; ปรับปรุงโดย เขมภูมิ ภูมิถาวร, ชวิน อุ่นภัทร, อำนาจ ตั้งคีร...",21,2.68,880-05 ละเมิด ไทย. 12155 880-06 จัดการงานนอกสั่ง ไทย. 215103 880-07 ลาภมิควรได้ ไทย. 215104,2021-08-20 10:53:06,"880-02 คำอธิบายประมวลกฎหมายแพ่งและพาณิชย์ เรียงมาตรา ว่าด้วยจัดการงานนอกสั่ง ลาภมิควรได้ ละเมิด บรรพ 2 มาตรา 395-452 / จิตติ ติงศภัทิย์ ; ปรับปรุงโดย เขมภูมิ ภูมิถาวร, ชวิน อุ่นภัทร, อำนาจ ตั้งคีร..."
712437,880-02 หลักกฎหมายมรดก / ไพโรจน์ กัมพูสิริ.,21,2.68,880-05 มรดกและการรับมรดก ไทย. 294853,2021-08-23 12:10:26,880-02 หลักกฎหมายมรดก / ไพโรจน์ กัมพูสิริ. 880-05 มรดกและการรับมรดก ไทย. 294853
647540,880-02 กฎหมายระหว่างประเทศ / จตุรนต์ ถิระวัฒน์.,21,2.68,880-05 กฎหมายระหว่างประเทศ. 182649 880-06 สัญญาระหว่างประเทศ. 33842,2021-08-14 12:50:00,880-02 กฎหมายระหว่างประเทศ / จตุรนต์ ถิระวัฒน์. 880-05 กฎหมายระหว่างประเทศ. 182649 880-06 สัญญาระหว่างประเทศ. 33842
702492,880-02 บริหารธุรกิจ: ความสำเร็จและความยั่งยืนบนการสร้างคุณค่า = Business : creating value for success and sustainability / วิทยา ด่านธำรงกูล.,20,2.6,880-05 การจัดการอุตสาหกรรม. 85783 880-06 การจัดการอุตสาหกรรม ไทย. 87424 880-07 การสร้างสรรค์ทางธุรกิจ ไทย. 313091 880-08 ความเป็นผู้ประกอบการทางสังคม ไทย. 633226 880-09 ความรับผิดชอบต่อสังคมของธุร...,2021-08-18 10:20:41,880-02 บริหารธุรกิจ: ความสำเร็จและความยั่งยืนบนการสร้างคุณค่า = Business : creating value for success and sustainability / วิทยา ด่านธำรงกูล. 880-05 การจัดการอุตสาหกรรม. 85783 880-06 การจัดการอุตส...
672974,880-02 ความรู้เบื้องต้นเกี่ยวกับกฎหมายเศรษฐกิจระหว่างประเทศ = Introduction to international economc law / นาถนิรันดร์ จันทร์งาม.,19,2.52,ระเบียบการค้าต่างประเทศ. 880-05 51619 880-06 การเงินระหว่างประเทศ กฎหมายและระเบียบข้อบังคับ. 404828 880-07 การลงทุนของต่างประเทศ กฎหมายและระเบียบข้อบังคับ. 553777,2021-08-20 11:16:12,880-02 ความรู้เบื้องต้นเกี่ยวกับกฎหมายเศรษฐกิจระหว่างประเทศ = Introduction to international economc law / นาถนิรันดร์ จันทร์งาม. ระเบียบการค้าต่างประเทศ. 880-05 51619 880-06 การเงินระหว่างประเทศ ก...


In [9]:
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.metrics import mean_squared_error

In [10]:
content_cosine_sim = cosine_similarity(count_matrix, count_matrix)
content_cosine_sim.shape

(6235, 6235)

In [11]:
content_sim_df = pd.DataFrame(content_cosine_sim, index=content_df[:r_limit].index, columns=content_df[:r_limit].index)
content_sim_df

biblionumber,600363,714806,608784,696113,664720,696854,712437,647540,702492,672974,...,671823,689374,656738,609882,681890,624862,706373,643072,643007,666265
biblionumber,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
600363,1.0,0.0,1.0,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.0
714806,0.0,1.0,0.0,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.000000,0.000000,0.000000,0.1,0.0,0.0,0.0
608784,1.0,0.0,1.0,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.0
696113,0.0,0.0,0.0,1.000000,0.235702,0.331042,0.377964,0.375000,0.393106,0.322329,...,0.410152,0.243855,0.0,0.000000,0.000000,0.000000,0.0,0.0,0.0,0.0
664720,0.0,0.0,0.0,0.235702,1.000000,0.195069,0.267261,0.265165,0.221470,0.189934,...,0.209460,0.123797,0.0,0.036370,0.000000,0.133333,0.0,0.0,0.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
624862,0.0,0.0,0.0,0.000000,0.133333,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.130931,0.000000,1.000000,0.0,0.0,0.0,0.0
706373,0.0,0.1,0.0,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.000000,0.000000,0.000000,1.0,0.0,0.0,0.0
643072,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.000000,0.089722,0.000000,0.0,1.0,0.0,0.0
643007,0.0,0.0,0.0,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,...,0.000000,0.000000,0.0,0.000000,0.000000,0.000000,0.0,0.0,1.0,0.0


In [12]:
from joblib import dump, load

In [13]:
dump(content_sim_df, 'content_sim_df.joblib')

['content_sim_df.joblib']

In [14]:
dump(content_df, 'book_map.joblib')

['book_map.joblib']

In [15]:
indices = content_sim_df.loc["611661"].sort_values(ascending=False).index
content_df.loc[indices].head(100)

KeyError: '611661'

In [16]:
def sim_content(bib): 
    indices = content_sim_df.loc[bib].sort_values(ascending=False).index
    return content_df.loc[indices]

In [17]:
content_df[content_df['title'].str.match('.*king.*')  == True].head(20)

Unnamed: 0_level_0,title,rating_count,rating_avg,soup,ts,soup_final
biblionumber,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
707680,880-02 หลักพื้นฐานของกฎหมายการลงทุนระหว่างประเทศและการดำเนินการลงทุนระหว่างประเทศ = Fundamentals of international investment law and the making of international investments / นาถนิรันดร์ จันทร์งาม.,15,2.2,880-05 การลงทุน กฎหมายและระเบียบข้อบังคับ. 506849 880-06 การค้าระหว่างประเทศ กฎหมายและระเบียบข้อบังคับ. 787136 880-07 การลงทุนของต่างประเทศ กฎหมายและระเบียบข้อบังคับ. 553777 880-08 การลงทุน. 18920,2021-08-20 10:04:26,880-02 หลักพื้นฐานของกฎหมายการลงทุนระหว่างประเทศและการดำเนินการลงทุนระหว่างประเทศ = Fundamentals of international investment law and the making of international investments / นาถนิรันดร์ จันทร์งาม...
696075,880-02 คู่มือออกแบบชีวิตด้วย Design thinking / Bill Burnett & Dave Evans ; เมษ์ ศรีพัฒนาสกุล แปล.,4,1.32,880-05 การแนะแนวอาชีพ. 27774 880-06 การสำนึกตนเอง. 29003 880-07 การออกแบบ แง่สังคม. 552424 880-08 การตัดสินใจ. 19627,2021-07-27 11:11:18,880-02 คู่มือออกแบบชีวิตด้วย Design thinking / Bill Burnett & Dave Evans ; เมษ์ ศรีพัฒนาสกุล แปล. 880-05 การแนะแนวอาชีพ. 27774 880-06 การสำนึกตนเอง. 29003 880-07 การออกแบบ แง่สังคม. 552424 880-08 ...
714535,880-02 ศิลปะแห่งการอ่านคน = Talking to strangers / มัลคอล์ม แกลดเวลล์ ผู้เขียน ; นุชนาฎ เนตรประเสริฐศรี ผู้แปล.,4,1.32,813390 มนุษยสัมพันธ์ ปกิณกะ. 880-05 28345 จิตวิทยาประยุกต์. 880-06 813391 คนแปลกหน้า. 880-07 103863 การข่มขวัญ (จิตวิทยา) 880-08 255271 การดำเนินชีวิต ปกิณกะ. 880-09 585179 ความเชื่อถือ. 880-10 มน...,2021-08-05 11:07:15,880-02 ศิลปะแห่งการอ่านคน = Talking to strangers / มัลคอล์ม แกลดเวลล์ ผู้เขียน ; นุชนาฎ เนตรประเสริฐศรี ผู้แปล. 813390 มนุษยสัมพันธ์ ปกิณกะ. 880-05 28345 จิตวิทยาประยุกต์. 880-06 813391 คนแปลกหน้า...
716519,"880-02 ประวัติศาสตร์สแกนดิเนเวีย : จากแดนอารยธรรมไวกิ้ง สู่ต้นแบบรัฐสวัสดิการโลกร่วมสมัย สังคมเสรีประชาธิปไตย และกำเนิดบลูทูธ! = History of Scandinavia : from the Viking age to welfare states, soc...",3,1.24,,2021-07-12 09:40:44,"880-02 ประวัติศาสตร์สแกนดิเนเวีย : จากแดนอารยธรรมไวกิ้ง สู่ต้นแบบรัฐสวัสดิการโลกร่วมสมัย สังคมเสรีประชาธิปไตย และกำเนิดบลูทูธ! = History of Scandinavia : from the Viking age to welfare states, soc..."
689721,880-02 ฮุกกะ : ปรัชญาความสุขฉบับเดนมาร์ก / โดย Meik Wiking ; พลอยแสง เอกญาติ แปล.,3,1.24,880-05 การตระหนักตนเอง. 226636 880-06 ความสุข เดนมาร์ก. 783074 880-07 การดำเนินชีวิต. 23387,2021-08-17 09:06:11,880-02 ฮุกกะ : ปรัชญาความสุขฉบับเดนมาร์ก / โดย Meik Wiking ; พลอยแสง เอกญาติ แปล. 880-05 การตระหนักตนเอง. 226636 880-06 ความสุข เดนมาร์ก. 783074 880-07 การดำเนินชีวิต. 23387
708455,"880-02 คู่มือการคิดเชิงออกแบบ = The design thinking playbook / Michael Lewrick, Patrick Link, Larry Leifer เขียน ; วิญญู กิ่งหิรัญวัฒนา แปล.",3,1.24,880-05 การสร้างสรรค์ทางเทคโนโลยี. 463425 880-06 การสร้างสรรค์ทางธุรกิจ. 152102 880-07 ความคิดสร้างสรรค์. 52504 880-08 การจัดการอุตสาหกรรม นวัตกรรมทางเทคโนโลยี. 608315 880-09 นวัตกรรมทางเทคโนโลยี. ...,2021-04-29 10:39:13,"880-02 คู่มือการคิดเชิงออกแบบ = The design thinking playbook / Michael Lewrick, Patrick Link, Larry Leifer เขียน ; วิญญู กิ่งหิรัญวัฒนา แปล. 880-05 การสร้างสรรค์ทางเทคโนโลยี. 463425 880-06 การสร้า..."
713402,880-02 ว่าด้วยความคิดทางการเมืองของฌาคส์ ร็องซีแยร์ = The political thinking of Jacques Ranciere / ไชยรัตน์ เจริญสินโอฬาร,3,1.24,880-06 178938 การเมือง. 44547 880-07 รัฐศาสตร์ ปรัชญา.,2021-02-07 17:40:58,880-02 ว่าด้วยความคิดทางการเมืองของฌาคส์ ร็องซีแยร์ = The political thinking of Jacques Ranciere / ไชยรัตน์ เจริญสินโอฬาร 880-06 178938 การเมือง. 44547 880-07 รัฐศาสตร์ ปรัชญา.
714673,An introduction to service design thinking / Kom Campiranon.,2,1.16,324663 Service industries Management. 17560 Customer services Management. 250984 Customer relations Management.,2021-08-19 13:31:14,An introduction to service design thinking / Kom Campiranon. 324663 Service industries Management. 17560 Customer services Management. 250984 Customer relations Management.
718202,Learning to think things through : a guide to critical thinking across the curriculum / Gerald M. Nosich.,1,1.08,"423454 Critical thinking Study and teaching. 70837 Interdisciplinary approach in education. ""For Freshman Orientation or Critical Thinking courses as well as a supplementary text for use in any su...",2021-08-11 08:43:37,Learning to think things through : a guide to critical thinking across the curriculum / Gerald M. Nosich. 423454 Critical thinking Study and teaching. 70837 Interdisciplinary approach in education...
718203,The Pearson guide to critical and creative thinking / Robert DiYanni.,1,1.08,"37478 Critical thinking. 10139 Creative thinking. The first edition of The Pearson Guide to Critical and Creative Thinking provides students with the tools, techniques, and strategies for thinking...",2021-08-11 08:43:30,The Pearson guide to critical and creative thinking / Robert DiYanni. 37478 Critical thinking. 10139 Creative thinking. The first edition of The Pearson Guide to Critical and Creative Thinking pro...


In [18]:
h = sim_content("614438")
h.head(10)

KeyError: '614438'

In [19]:
ratings.head(100)

Unnamed: 0,borrowernumber,biblionumber,rating
0,3222,161503,5.0
1,3222,619849,5.0
2,3222,690445,5.0
3,3222,679121,5.0
4,174597,53551,1.0
5,174597,53551,1.0
6,174597,714237,1.0
7,174597,696847,1.4
8,174597,428647,1.4
9,174597,600981,1.4


In [20]:
from surprise import dump
_, knn_u_bl = dump.load('knn_u_bl')

In [21]:
list(knn_u_bl.trainset.all_ratings())

[(0, 0, 1.4),
 (0, 975, 5.0),
 (0, 1762, 1.7999999999999998),
 (0, 3100, 1.7999999999999998),
 (0, 4615, 1.7999999999999998),
 (0, 3936, 5.0),
 (0, 7352, 4.6),
 (0, 679, 2.952),
 (0, 8643, 1.4),
 (0, 7352, 4.6),
 (0, 11204, 4.776),
 (0, 10479, 1.4),
 (0, 12552, 1.7999999999999998),
 (0, 14473, 1.7999999999999998),
 (0, 6397, 5.0),
 (0, 16749, 5.0),
 (0, 16920, 5.0),
 (0, 17442, 1.7999999999999998),
 (0, 17891, 1.7999999999999998),
 (0, 4504, 3.8),
 (0, 17080, 4.2),
 (0, 26974, 1.4),
 (0, 5948, 5.0),
 (1, 1, 1.7999999999999998),
 (2, 2, 3.768),
 (2, 1877, 3.768),
 (2, 5618, 3.768),
 (2, 8285, 2.4079999999999995),
 (2, 20166, 3.7359999999999998),
 (2, 24921, 3.768),
 (2, 8285, 2.4079999999999995),
 (3, 3, 1.4),
 (3, 1011, 2.3759999999999994),
 (3, 3384, 1.4),
 (3, 3558, 2.776),
 (3, 4292, 2.5359999999999996),
 (3, 5255, 2.5039999999999996),
 (3, 5640, 1.0),
 (3, 6626, 1.0),
 (3, 6878, 1.4),
 (3, 7413, 1.8319999999999999),
 (3, 9457, 2.5679999999999996),
 (3, 9628, 2.872),
 (3, 10230, 2.5

In [22]:
iuid = knn_u_bl.trainset.to_inner_uid("68")
iuid

3429

In [23]:
kusers = knn_u_bl.get_neighbors(iuid, k=100)
ku_raw = (knn_u_bl.trainset.to_raw_uid(i) for i in kusers)
list(ku_raw)

['131500',
 '171232',
 '908',
 '142752',
 '109892',
 '160260',
 '133070',
 '98118',
 '133072',
 '122306',
 '167155',
 '144905',
 '111812',
 '100584',
 '156715',
 '151796',
 '140118',
 '100510',
 '136109',
 '90576',
 '60446',
 '134473',
 '118780',
 '139970',
 '133588',
 '159787',
 '1184',
 '133096',
 '116658',
 '138823',
 '139516',
 '138628',
 '117946',
 '167329',
 '65160',
 '145200',
 '164444',
 '70299',
 '1337',
 '149763',
 '131495',
 '85749',
 '113119',
 '132833',
 '162215',
 '139923',
 '145027',
 '73734',
 '141100',
 '112024',
 '116217',
 '98097',
 '151229',
 '7465',
 '117642',
 '139931',
 '145863',
 '144725',
 '1567',
 '158699',
 '34718',
 '113281',
 '73555',
 '1113',
 '144631',
 '73492',
 '144888',
 '150217',
 '160248',
 '139510',
 '3203',
 '139534',
 '112086',
 '159538',
 '150568',
 '387',
 '161221',
 '145674',
 '117637',
 '133080',
 '145829',
 '117998',
 '141720',
 '116006',
 '141989',
 '51977',
 '140461',
 '146331',
 '154564',
 '19398',
 '148505',
 '131918',
 '147515',
 '60704'