-
Notifications
You must be signed in to change notification settings - Fork 76
视频数据库的使用
OctoMiao edited this page Mar 22, 2018
·
4 revisions
一个 Class 用来把数据库的数据 import 到 Python 里面
class Cleaner:
def __init__(self):
self.raw = []
self.data = []
def hay(self,path):
with open(path) as f:
for line in f:
self.raw.append(line)
def dval(self, bgp=None,edp=None, seg=None):
if bgp == None:
bgp = 7
if edp == None:
edp = -1
if seg == None:
seg = 2
arr = self.raw[bgp:edp:seg]
data1 = []
for elem in arr:
data1.append( elem[38:-2] )
for elem in data1:
self.data.append( elem.split(",") )
for i in range(len(self.data)):
for j in range( len(self.data[i]) ):
self.data[i][j] = int( (self.data)[i][j] )
使用方法
file="../Bilibi-Video-2018-2-28/124.db.log"
dt = Cleaner() # Create the data cleaner object
dt.raw # Check the raw data of the object, this should return []
dt.hay(file) # Call hay() function to get the haystack
dt.dval() # Clean up data and store data in dt.data
(dt.data)[0][1] # Check the clean data you have
如果写代码的话,可能会需要一个分区号和分区名称的字典,下面是一个 Python 字典的例子。
sects = {'12': '公告', '15': '连载剧集', '16': 'flash游戏', '17': '单机联机', '19': 'Mugen', '20': '宅舞', '21': '日常', '22': '鬼畜调教', '24': 'MAD-AMV', '25': 'MMD-3D', '26': '音MAD', '27': '综合', '28': '原创音乐', '29': '三次元音乐', '30': 'VOCALOID-UTAU', '31': '翻唱', '32': '完结动画', '33': '连载动画', '37': '人文历史', '39': '演讲-公开课', '41': '未知', '46': 'MMD.3D', '47': '短片-手书-配音', '50': '短片-手书-配音', '51': '资讯', '53': '综合', '54': 'OP-ED-OST', '56': 'VOCALOID', '59': '演奏', '60': '电子竞技', '65': '网络游戏', '67': '单机游戏', '71': '综艺', '74': '日常', '75': '动物圈', '76': '美食圈', '77': '喵星人', '79': '其他', '80': '美食视频', '82': '电影相关', '83': '其他国家', '85': '短片', '86': '特摄', '94': '剧场版', '95': '数码', '96': '星海', '98': '机械', '114': '国内综艺', '116': '游戏', '118': '其他', '120': '剧场版', '121': 'GMV', '122': '野生技术协会', '124': '趣味科普人文', '125': '其他', '126': '人力VOCALOID', '127': '教程演示', '128': '电视剧相关', '130': '音乐选集', '131': 'Korea相关', '134': '其他', '135': '活动', '136': '音游', '137': '明星', '138': '搞笑', '139': '实况解说', '141': '游戏集锦', '145': '欧美电影', '146': '日本电影', '147': '国产电影', '152': '官方延伸', '153': '国产动画', '154': '三次元舞蹈', '156': '舞蹈教程', '157': '美妆', '158': '服饰', '159': '资讯', '161': '手工', '162': '绘画', '163': '运动', '164': '健身', '165': '广告', '166': '广告', '168': '国产原创相关', '169': '布袋戏', '170': '资讯', '171': '电子竞技', '172': '手机游戏', '173': '桌游棋牌', '174': '其他', '175': 'ASMR', '176': '汽车', '178': '科学探索', '179': '热血军事', '180': '舌尖上的旅行', '182': '影视杂谈', '183': '影视剪辑', '184': '预告 资讯', '185': '国产剧', '187': '海外剧'}