Spaces:

alexchenc10
/

aicomp_demo

Running

aicomp_demo / src /train.py

ceasonen

我的视网膜检测网站

04103fb 4 days ago

29.3 kB

	"""
	训练模块
	包含训练循环、验证、早停等功能
	"""

	import os
	import time
	import copy
	import yaml
	import torch
	import torch.nn as nn
	import torch.optim as optim
	from torch.optim.lr_scheduler import CosineAnnealingLR, StepLR, ReduceLROnPlateau
	from torch.cuda.amp import GradScaler, autocast
	import numpy as np
	from sklearn.metrics import accuracy_score, precision_recall_fscore_support, confusion_matrix
	import matplotlib.pyplot as plt
	import seaborn as sns
	from tqdm import tqdm
	from typing import Dict, List, Tuple, Optional
	import logging
	from tensorboardX import SummaryWriter

	from src.data_loader import create_data_loaders, get_class_weights
	from src.models import create_model, count_parameters, model_size_mb
	from utils.metrics import calculate_metrics, plot_confusion_matrix


	class EarlyStopping:
	"""早停机制"""

	def __init__(self, patience: int = 7, min_delta: float = 0.0,
	restore_best_weights: bool = True):
	self.patience = patience
	self.min_delta = min_delta
	self.restore_best_weights = restore_best_weights
	self.best_loss = None
	self.counter = 0
	self.best_weights = None

	def __call__(self, val_loss: float, model: nn.Module) -> bool:
	if self.best_loss is None:
	self.best_loss = val_loss
	self.best_weights = copy.deepcopy(model.state_dict())
	elif val_loss < self.best_loss - self.min_delta:
	self.best_loss = val_loss
	self.counter = 0
	self.best_weights = copy.deepcopy(model.state_dict())
	else:
	self.counter += 1

	if self.counter >= self.patience:
	if self.restore_best_weights:
	model.load_state_dict(self.best_weights)
	return True
	return False


	class DRTrainer:
	def run_qat(self):
	"""量化感知训练（QAT）流程"""
	qat_cfg = self.config['training']
	if not qat_cfg.get('qat', False):
	return
	import copy
	import torch.quantization as tq
	qat_epochs = qat_cfg.get('qat_epochs', 10)
	qat_backend = qat_cfg.get('qat_backend', 'fbgemm')
	export_path = qat_cfg.get('qat_export_path', 'weights/qat_model.onnx')
	self.logger.info(f"开始QAT微调: epochs={qat_epochs}, backend={qat_backend}")

	# 1. 准备量化模型
	model_qat = copy.deepcopy(self.model).to(self.device)
	model_qat.train()
	model_qat.fuse_model = getattr(model_qat, 'fuse_model', None)
	if model_qat.fuse_model:
	model_qat.fuse_model()
	tq.backend = qat_backend
	model_qat.qconfig = tq.get_default_qat_qconfig(qat_backend)
	tq.prepare_qat(model_qat, inplace=True)

	optimizer = torch.optim.Adam(model_qat.parameters(), lr=1e-4)
	criterion = nn.CrossEntropyLoss()

	# 2. QAT训练
	for epoch in range(qat_epochs):
	model_qat.train()
	running_loss = 0.0
	correct = 0
	total = 0
	for images, labels in self.train_loader:
	images, labels = images.to(self.device), labels.to(self.device)
	optimizer.zero_grad()
	outputs = model_qat(images)
	loss = criterion(outputs, labels)
	loss.backward()
	optimizer.step()
	running_loss += loss.item()
	_, predicted = outputs.max(1)
	total += labels.size(0)
	correct += predicted.eq(labels).sum().item()
	avg_loss = running_loss / len(self.train_loader)
	acc = 100. * correct / total
	self.logger.info(f"[QAT] Epoch {epoch+1}/{qat_epochs} Loss: {avg_loss:.4f} Acc: {acc:.2f}%")

	# 3. 转换为量化模型
	model_qat.eval()
	model_int8 = tq.convert(model_qat.cpu().eval(), inplace=False)
	self.logger.info("QAT模型量化完成，准备导出ONNX...")

	# 4. 导出ONNX
	dummy = torch.randn(1, 3, self.config['data']['image_size'], self.config['data']['image_size'])
	torch.onnx.export(model_int8, dummy, export_path, input_names=['input'], output_names=['output'], opset_version=12)
	self.logger.info(f"QAT量化模型已导出: {export_path}")
	"""糖尿病视网膜病变检测模型训练器"""

	def __init__(self, config: dict):
	self.config = config
	self.device = torch.device(
	f"cuda:{config['device']['gpu_id']}"
	if config['device']['use_gpu'] and torch.cuda.is_available()
	else "cpu"
	)

	# 创建日志目录
	os.makedirs(config['logging']['log_dir'], exist_ok=True)
	os.makedirs(config['logging']['tensorboard_dir'], exist_ok=True)
	# 确保权重保存目录存在
	os.makedirs(os.path.dirname(config['training']['model_save_path']), exist_ok=True)

	# 设置日志
	self._setup_logging()

	# 初始化模型
	self.model = create_model(config).to(self.device)
	self.logger.info(f"模型参数数量: {count_parameters(self.model):,}")
	self.logger.info(f"模型大小: {model_size_mb(self.model):.2f} MB")

	# 创建数据加载器
	self.train_loader, self.val_loader, self.test_loader = create_data_loaders(config)


	# === 知识蒸馏相关 ===
	self.distill = self.config['training'].get('distill', False)
	self.teacher_model = None
	if self.distill:
	from utils.losses import DistillationLoss
	teacher_name = self.config['training'].get('distill_teacher', 'efficientnet_b3')
	student_name = self.config['training'].get('distill_student', self.config['model']['name'])
	# student模型用config['model']，teacher模型用teacher_name
	teacher_config = copy.deepcopy(self.config)
	teacher_config['model']['name'] = teacher_name
	self.teacher_model = create_model(teacher_config).to(self.device)
	self.teacher_model.eval()
	# teacher权重加载（如有）
	teacher_ckpt = self.config['training'].get('distill_teacher_ckpt', None)
	if teacher_ckpt and os.path.exists(teacher_ckpt):
	state = torch.load(teacher_ckpt, map_location=self.device)
	if 'model_state_dict' in state:
	self.teacher_model.load_state_dict(state['model_state_dict'])
	else:
	self.teacher_model.load_state_dict(state)
	self.logger.info(f"已加载teacher模型权重: {teacher_ckpt}")
	else:
	self.logger.warning("未指定teacher权重，teacher模型将使用随机初始化！")
	alpha = self.config['training'].get('distill_alpha', 0.7)
	beta = self.config['training'].get('distill_beta', 0.3)
	temperature = self.config['training'].get('distill_temperature', 4.0)
	self.criterion = DistillationLoss(alpha=alpha, beta=beta, temperature=temperature)
	else:
	# 创建损失函数（支持类别权重、Focal Loss）
	label_smoothing = self.config['training'].get('label_smoothing', 0.0)
	use_focal = self.config['training'].get('use_focal_loss', False)
	class_weights = None
	if config['data'].get('use_class_weights', False):
	class_weights = get_class_weights(
	config['data']['train_dir'],
	config['model']['num_classes']
	).to(self.device)
	# 自动写入 config.yaml
	try:
	with open('configs/config.yaml', 'r', encoding='utf-8') as f:
	cfg = yaml.safe_load(f)
	cfg['training']['class_weights'] = [float(w) for w in class_weights.cpu().numpy()]
	with open('configs/config.yaml', 'w', encoding='utf-8') as f:
	yaml.dump(cfg, f, allow_unicode=True)
	except Exception as e:
	self.logger.warning(f"自动写入类别权重到 config.yaml 失败: {e}")

	if use_focal:
	from utils.losses import FocalLoss
	gamma = self.config['training'].get('focal_gamma', 2.0)
	alpha = self.config['training'].get('focal_alpha', None)
	if alpha is not None:
	alpha = torch.tensor(alpha, dtype=torch.float32, device=self.device)
	elif class_weights is not None:
	alpha = class_weights
	self.criterion = FocalLoss(alpha=alpha, gamma=gamma)
	else:
	self.criterion = nn.CrossEntropyLoss(
	weight=class_weights,
	label_smoothing=label_smoothing if label_smoothing > 0 else 0.0,
	)

	# 创建优化器
	self.optimizer = self._create_optimizer()

	# 创建学习率调度器
	self.scheduler = self._create_scheduler()

	# 混合精度训练
	self.use_amp = config['device'].get('mixed_precision', False)
	if self.use_amp:
	self.scaler = GradScaler()

	# 早停
	early_stopping_config = config['training']
	self.early_stopping = EarlyStopping(
	patience=early_stopping_config.get('early_stopping_patience', 10)
	)

	# TensorBoard
	self.writer = SummaryWriter(config['logging']['tensorboard_dir'])

	# 训练历史
	self.train_history = {
	'train_loss': [],
	'train_acc': [],
	'val_loss': [],
	'val_acc': [],
	'lr': []
	}

	self.best_val_acc = 0.0
	self.start_epoch = 0

	def _setup_logging(self):
	"""设置日志"""
	log_file = os.path.join(self.config['logging']['log_dir'], 'training.log')
	logging.basicConfig(
	level=logging.INFO,
	format='%(asctime)s - %(levelname)s - %(message)s',
	handlers=[
	logging.FileHandler(log_file, encoding='utf-8'),
	logging.StreamHandler()
	]
	)
	self.logger = logging.getLogger(__name__)

	def _create_optimizer(self) -> optim.Optimizer:
	"""创建优化器"""
	opt_config = self.config['optimizer']
	lr = self.config['training']['learning_rate']
	weight_decay = self.config['training']['weight_decay']

	if opt_config['name'].lower() == 'adam':
	optimizer = optim.Adam(
	self.model.parameters(),
	lr=lr,
	weight_decay=weight_decay,
	betas=(opt_config.get('beta1', 0.9), opt_config.get('beta2', 0.999))
	)
	elif opt_config['name'].lower() == 'adamw':
	optimizer = optim.AdamW(
	self.model.parameters(),
	lr=lr,
	weight_decay=weight_decay,
	betas=(opt_config.get('beta1', 0.9), opt_config.get('beta2', 0.999))
	)
	elif opt_config['name'].lower() == 'sgd':
	optimizer = optim.SGD(
	self.model.parameters(),
	lr=lr,
	weight_decay=weight_decay,
	momentum=opt_config.get('momentum', 0.9)
	)
	else:
	raise ValueError(f"不支持的优化器: {opt_config['name']}")

	return optimizer

	def _create_scheduler(self):
	"""创建学习率调度器"""
	scheduler_name = self.config['training'].get('scheduler', 'cosine')

	if scheduler_name == 'cosine':
	scheduler = CosineAnnealingLR(
	self.optimizer,
	T_max=self.config['training']['epochs']
	)
	elif scheduler_name == 'step':
	scheduler = StepLR(
	self.optimizer,
	step_size=30,
	gamma=0.1
	)
	elif scheduler_name == 'plateau':
	scheduler = ReduceLROnPlateau(
	self.optimizer,
	mode='min',
	factor=0.5,
	patience=5,
	verbose=True
	)
	else:
	scheduler = None

	return scheduler

	def train_epoch(self, epoch: int) -> Tuple[float, float]:
	"""训练一个epoch，支持多任务（分级+二分类）"""
	self.model.train()
	running_loss = 0.0
	correct = 0
	total = 0
	correct_bin = 0
	total_bin = 0

	progress_bar = tqdm(self.train_loader, desc=f'Epoch {epoch+1}')

	for batch_idx, batch in enumerate(progress_bar):
	# 支持(images, label, is_diabetic) 或 (images, label)
	if len(batch) == 3:
	images, labels, is_diabetic = batch
	images = images.to(self.device)
	labels = labels.to(self.device)
	is_diabetic = is_diabetic.to(self.device).float()
	else:
	images, labels = batch
	images = images.to(self.device)
	labels = labels.to(self.device)
	is_diabetic = None

	self.optimizer.zero_grad()

	if self.use_amp:
	with autocast():
	outputs = self.model(images)
	if isinstance(outputs, dict):
	loss_grading = self.criterion(outputs['grading'], labels)
	if is_diabetic is not None:
	loss_diabetic = nn.BCEWithLogitsLoss()(outputs['diabetic'], is_diabetic)
	loss = loss_grading + loss_diabetic
	else:
	loss = loss_grading
	else:
	loss = self.criterion(outputs, labels)
	self.scaler.scale(loss).backward()
	self.scaler.step(self.optimizer)
	self.scaler.update()
	else:
	outputs = self.model(images)
	if isinstance(outputs, dict):
	loss_grading = self.criterion(outputs['grading'], labels)
	if is_diabetic is not None:
	loss_diabetic = nn.BCEWithLogitsLoss()(outputs['diabetic'], is_diabetic)
	loss = loss_grading + loss_diabetic
	else:
	loss = loss_grading
	else:
	loss = self.criterion(outputs, labels)
	loss.backward()
	self.optimizer.step()

	# 统计分级准确率
	if isinstance(outputs, dict):
	out_grading = outputs['grading']
	_, predicted = out_grading.max(1)
	else:
	predicted = outputs.max(1)[1]
	total += labels.size(0)
	correct += predicted.eq(labels).sum().item()

	# 统计二分类准确率
	if is_diabetic is not None and isinstance(outputs, dict):
	out_bin = torch.sigmoid(outputs['diabetic'])
	pred_bin = (out_bin > 0.5).long()
	correct_bin += pred_bin.eq(is_diabetic.long()).sum().item()
	total_bin += is_diabetic.size(0)

	running_loss += loss.item()

	# 更新进度条
	postfix = {'Loss': f'{loss.item():.4f}', 'Acc': f'{100.*correct/total:.2f}%'}
	if total_bin > 0:
	postfix['BinAcc'] = f'{100.*correct_bin/total_bin:.2f}%'
	progress_bar.set_postfix(postfix)

	epoch_loss = running_loss / len(self.train_loader)
	epoch_acc = 100. * correct / total
	return epoch_loss, epoch_acc

	def validate(self) -> Tuple[float, float, Dict]:
	"""多任务验证，输出分级和二分类准确率"""
	self.model.eval()
	running_loss = 0.0
	all_predictions = []
	all_labels = []
	all_bin_preds = []
	all_bin_labels = []

	with torch.no_grad():
	for batch in tqdm(self.val_loader, desc='Validating'):
	if len(batch) == 3:
	images, labels, is_diabetic = batch
	images = images.to(self.device)
	labels = labels.to(self.device)
	is_diabetic = is_diabetic.to(self.device).float()
	else:
	images, labels = batch
	images = images.to(self.device)
	labels = labels.to(self.device)
	is_diabetic = None

	if self.use_amp:
	with autocast():
	outputs = self.model(images)
	if isinstance(outputs, dict):
	loss_grading = self.criterion(outputs['grading'], labels)
	if is_diabetic is not None:
	loss_diabetic = nn.BCEWithLogitsLoss()(outputs['diabetic'], is_diabetic)
	loss = loss_grading + loss_diabetic
	else:
	loss = loss_grading
	else:
	loss = self.criterion(outputs, labels)
	else:
	outputs = self.model(images)
	if isinstance(outputs, dict):
	loss_grading = self.criterion(outputs['grading'], labels)
	if is_diabetic is not None:
	loss_diabetic = nn.BCEWithLogitsLoss()(outputs['diabetic'], is_diabetic)
	loss = loss_grading + loss_diabetic
	else:
	loss = loss_grading
	else:
	loss = self.criterion(outputs, labels)

	running_loss += loss.item()

	# 分级预测
	if isinstance(outputs, dict):
	out_grading = outputs['grading']
	_, predicted = out_grading.max(1)
	else:
	predicted = outputs.max(1)[1]
	all_predictions.extend(predicted.cpu().numpy())
	all_labels.extend(labels.cpu().numpy())

	# 二分类预测
	if is_diabetic is not None and isinstance(outputs, dict):
	out_bin = torch.sigmoid(outputs['diabetic'])
	pred_bin = (out_bin > 0.5).long()
	all_bin_preds.extend(pred_bin.cpu().numpy())
	all_bin_labels.extend(is_diabetic.cpu().numpy())

	val_loss = running_loss / len(self.val_loader)
	val_acc = 100. * accuracy_score(all_labels, all_predictions)
	metrics = calculate_metrics(all_labels, all_predictions)
	# 二分类准确率
	if all_bin_labels:
	bin_acc = 100. * accuracy_score(all_bin_labels, all_bin_preds)
	metrics['bin_acc'] = bin_acc
	return val_loss, val_acc, metrics

	def save_checkpoint(self, epoch: int, is_best: bool = False):
	"""保存检查点"""
	checkpoint = {
	'epoch': epoch,
	'model_state_dict': self.model.state_dict(),
	'optimizer_state_dict': self.optimizer.state_dict(),
	'best_val_acc': self.best_val_acc,
	'train_history': self.train_history,
	'config': self.config
	}

	if self.scheduler:
	checkpoint['scheduler_state_dict'] = self.scheduler.state_dict()

	# 保存最新检查点
	checkpoint_path = os.path.join(
	os.path.dirname(self.config['training']['model_save_path']),
	'last_checkpoint.pth'
	)
	torch.save(checkpoint, checkpoint_path)

	# 保存最佳模型
	if is_best:
	best_path = self.config['training']['model_save_path']
	torch.save(checkpoint, best_path)
	self.logger.info(f"保存最佳模型: {best_path}")

	def load_checkpoint(self, checkpoint_path: str):
	"""加载检查点"""
	if not os.path.exists(checkpoint_path):
	self.logger.info("未找到检查点，从头开始训练")
	return

	checkpoint = torch.load(checkpoint_path, map_location=self.device)
	self.model.load_state_dict(checkpoint['model_state_dict'])
	self.optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
	self.best_val_acc = checkpoint.get('best_val_acc', 0.0)
	self.start_epoch = checkpoint.get('epoch', 0) + 1
	self.train_history = checkpoint.get('train_history', self.train_history)

	if self.scheduler and 'scheduler_state_dict' in checkpoint:
	self.scheduler.load_state_dict(checkpoint['scheduler_state_dict'])

	self.logger.info(f"从epoch {self.start_epoch} 恢复训练")

	def train(self):
	"""完整的训练流程"""
	self.logger.info("开始训练...")
	self.logger.info(f"训练设备: {self.device}")
	self.logger.info(f"训练集大小: {len(self.train_loader.dataset)}")
	self.logger.info(f"验证集大小: {len(self.val_loader.dataset)}")

	# 尝试加载检查点
	checkpoint_path = os.path.join(
	os.path.dirname(self.config['training']['model_save_path']),
	'last_checkpoint.pth'
	)
	self.load_checkpoint(checkpoint_path)

	for epoch in range(self.start_epoch, self.config['training']['epochs']):
	start_time = time.time()

	# 训练
	train_loss, train_acc = self.train_epoch(epoch)

	# 验证
	val_loss, val_acc, val_metrics = self.validate()

	# 学习率调度
	if self.scheduler:
	if isinstance(self.scheduler, ReduceLROnPlateau):
	self.scheduler.step(val_loss)
	else:
	self.scheduler.step()

	# 记录历史
	current_lr = self.optimizer.param_groups[0]['lr']
	self.train_history['train_loss'].append(train_loss)
	self.train_history['train_acc'].append(train_acc)
	self.train_history['val_loss'].append(val_loss)
	self.train_history['val_acc'].append(val_acc)
	self.train_history['lr'].append(current_lr)

	# TensorBoard记录
	self.writer.add_scalar('Loss/Train', train_loss, epoch)
	self.writer.add_scalar('Loss/Val', val_loss, epoch)
	self.writer.add_scalar('Accuracy/Train', train_acc, epoch)
	self.writer.add_scalar('Accuracy/Val', val_acc, epoch)
	self.writer.add_scalar('Learning_Rate', current_lr, epoch)

	# 记录验证指标
	for metric_name, metric_value in val_metrics.items():
	if isinstance(metric_value, (int, float)):
	self.writer.add_scalar(f'Metrics/{metric_name}', metric_value, epoch)

	# 保存最佳模型
	is_best = val_acc > self.best_val_acc
	if is_best:
	self.best_val_acc = val_acc

	# 定期保存检查点
	if (epoch + 1) % self.config['logging']['save_frequency'] == 0 or is_best:
	self.save_checkpoint(epoch, is_best)

	# 计算训练时间
	epoch_time = time.time() - start_time

	# 打印结果
	self.logger.info(
	f"Epoch [{epoch+1}/{self.config['training']['epochs']}] "
	f"Train Loss: {train_loss:.4f} Train Acc: {train_acc:.2f}% "
	f"Val Loss: {val_loss:.4f} Val Acc: {val_acc:.2f}% "
	f"Time: {epoch_time:.2f}s LR: {current_lr:.6f}"
	)

	# 早停检查
	if self.early_stopping(val_loss, self.model):
	self.logger.info(f"Early stopping at epoch {epoch+1}")
	break

	self.logger.info(f"训练完成！最佳验证准确率: {self.best_val_acc:.2f}%")

	# 绘制训练曲线
	self.plot_training_history()

	# 在测试集上评估
	if self.test_loader:
	self.evaluate_on_test()

	# === QAT流程 ===
	self.run_qat()

	def plot_training_history(self):
	"""绘制训练历史曲线"""
	fig, axes = plt.subplots(2, 2, figsize=(15, 10))

	# 损失曲线
	axes[0, 0].plot(self.train_history['train_loss'], label='Train Loss')
	axes[0, 0].plot(self.train_history['val_loss'], label='Val Loss')
	axes[0, 0].set_title('Loss Curves')
	axes[0, 0].set_xlabel('Epoch')
	axes[0, 0].set_ylabel('Loss')
	axes[0, 0].legend()
	axes[0, 0].grid(True)

	# 准确率曲线
	axes[0, 1].plot(self.train_history['train_acc'], label='Train Acc')
	axes[0, 1].plot(self.train_history['val_acc'], label='Val Acc')
	axes[0, 1].set_title('Accuracy Curves')
	axes[0, 1].set_xlabel('Epoch')
	axes[0, 1].set_ylabel('Accuracy (%)')
	axes[0, 1].legend()
	axes[0, 1].grid(True)

	# 学习率曲线
	axes[1, 0].plot(self.train_history['lr'])
	axes[1, 0].set_title('Learning Rate')
	axes[1, 0].set_xlabel('Epoch')
	axes[1, 0].set_ylabel('Learning Rate')
	axes[1, 0].set_yscale('log')
	axes[1, 0].grid(True)

	# 最佳性能标记
	best_epoch = np.argmax(self.train_history['val_acc'])
	axes[1, 1].text(0.1, 0.8, f'Best Val Acc: {self.best_val_acc:.2f}%',
	transform=axes[1, 1].transAxes, fontsize=12)
	axes[1, 1].text(0.1, 0.7, f'Best Epoch: {best_epoch + 1}',
	transform=axes[1, 1].transAxes, fontsize=12)
	axes[1, 1].text(0.1, 0.6, f'Total Epochs: {len(self.train_history["val_acc"])}',
	transform=axes[1, 1].transAxes, fontsize=12)
	axes[1, 1].axis('off')

	plt.tight_layout()
	plt.savefig(os.path.join(self.config['logging']['log_dir'], 'training_history.png'),
	dpi=300, bbox_inches='tight')
	plt.close()

	def evaluate_on_test(self):
	"""多任务测试集评估"""
	self.logger.info("在测试集上评估模型...")
	# 加载最佳模型
	best_model_path = self.config['training']['model_save_path']
	if os.path.exists(best_model_path):
	checkpoint = torch.load(best_model_path, map_location=self.device)
	self.model.load_state_dict(checkpoint['model_state_dict'])

	self.model.eval()
	all_predictions = []
	all_labels = []
	all_bin_preds = []
	all_bin_labels = []

	with torch.no_grad():
	for batch in tqdm(self.test_loader, desc='Testing'):
	if len(batch) == 3:
	images, labels, is_diabetic = batch
	images = images.to(self.device)
	labels = labels.to(self.device)
	is_diabetic = is_diabetic.to(self.device).float()
	else:
	images, labels = batch
	images = images.to(self.device)
	labels = labels.to(self.device)
	is_diabetic = None

	outputs = self.model(images)
	# 分级预测
	if isinstance(outputs, dict):
	out_grading = outputs['grading']
	_, predicted = out_grading.max(1)
	else:
	predicted = outputs.max(1)[1]
	all_predictions.extend(predicted.cpu().numpy())
	all_labels.extend(labels.cpu().numpy())

	# 二分类预测
	if is_diabetic is not None and isinstance(outputs, dict):
	out_bin = torch.sigmoid(outputs['diabetic'])
	pred_bin = (out_bin > 0.5).long()
	all_bin_preds.extend(pred_bin.cpu().numpy())
	all_bin_labels.extend(is_diabetic.cpu().numpy())

	# 计算指标
	test_metrics = calculate_metrics(all_labels, all_predictions)
	if all_bin_labels:
	bin_acc = 100. * accuracy_score(all_bin_labels, all_bin_preds)
	test_metrics['bin_acc'] = bin_acc
	# 打印结果
	self.logger.info("测试集结果:")
	for metric_name, metric_value in test_metrics.items():
	if isinstance(metric_value, (int, float)):
	self.logger.info(f"{metric_name}: {metric_value:.4f}")
	# 绘制混淆矩阵
	cm = confusion_matrix(all_labels, all_predictions)
	plot_confusion_matrix(
	cm,
	self.config['data']['class_names'],
	save_path=os.path.join(self.config['logging']['log_dir'], 'confusion_matrix.png')
	)


	if __name__ == "__main__":
	# 加载配置
	with open("configs/config.yaml", 'r', encoding='utf-8') as f:
	config = yaml.safe_load(f)

	# 创建训练器并开始训练
	trainer = DRTrainer(config)
	trainer.train()