소스 검색

修改训练数据缺省值的问题

yangzeyu 1 년 전
부모
커밋
0f2127a4d3
2개의 변경된 파일7개의 추가작업 그리고 3개의 파일을 삭제
  1. 4 0
      gbdt_lr.py
  2. 3 3
      models/rank/data/config.py

+ 4 - 0
gbdt_lr.py

@@ -9,9 +9,13 @@ import pandas as pd
 
 def train(args):
     model_dir = os.path.join(args.model_path, args.city_uuid)
+    train_data_dir = os.path.dirname(args.train_data_path)
     if not os.path.exists(model_dir):
         os.makedirs(model_dir)
     
+    if not os.path.exists(train_data_dir):
+        os.makedirs(train_data_dir)
+    
     # 准备数据集  
     print("正在整合训练数据...")
     processor = DataProcess(args.city_uuid, args.train_data_path)

+ 3 - 3
models/rank/data/config.py

@@ -13,7 +13,7 @@ class CustConfig:
         "MD04_DIR_SAL_STORE_FLAG",                     # 直营店标识
         "BB_CUSTOMER_MANAGER_SCOPE_NAME",              # 零售户经营范围名称
         "PRODUCT_INSALE_QTY",                          # 在销品规数
-        "CUST_INVESTMENT",                             # 店铺资源投入建设
+        # "CUST_INVESTMENT",                             # 店铺资源投入建设
         
         # "NEW_PRODUCT_MEMBERS_QTY_SAMEPRICE_OCC",       # 新品订货量占同价类比重
         # "PRODUCT_LISTING_RATE",                        # 品规上架率
@@ -51,7 +51,7 @@ class CustConfig:
         "MD04_DIR_SAL_STORE_FLAG":                  {"method": "fillna", "opt": "fill", "value": "否", "type": "str"},
         "BB_CUSTOMER_MANAGER_SCOPE_NAME":           {"method": "fillna", "opt": "fill", "value": "否", "type": "str"},
         "PRODUCT_INSALE_QTY":                       {"method": "fillna", "opt": "mean", "type": "num"},
-        "CUST_INVESTMENT":                          {"method": "fillna", "opt": "mean", "type": "num"}
+        # "CUST_INVESTMENT":                          {"method": "fillna", "opt": "fill", "type": 0}
         
         
         # "NEW_PRODUCT_MEMBERS_QTY_SAMEPRICE_OCC":    {"method": "fillna", "opt": "mean", "type": "num"},
@@ -266,7 +266,7 @@ class ImportanceFeaturesMap:
         "MD04_DIR_SAL_STORE_FLAG":                          "直营店标识",
         "BB_CUSTOMER_MANAGER_SCOPE_NAME":                   "零售户经营范围名称",
         "PRODUCT_INSALE_QTY":                               "在销品规数",
-        "CUST_INVESTMENT":                                  "店铺资源投入建设",
+        # "CUST_INVESTMENT":                                  "店铺资源投入建设",
     }
     
     PRODUCT_FEATRUES_MAP = {