sparkle-server / app.py

Commit History

✨ feat: 在流生成器中添加完整响应打印功能,增强调试信息
9c0355b
Running

iridescent commited on

🦄 refactor: 重构 Dockerfile 和 app.py,优化多阶段构建,增强模型加载和 API 逻辑,更新 README 文档以反映新特性
7dce215

iridescent commited on

🐳 chore: 更新模型配置为Qwen3系列8B,使用8位量化版本以优化性能和质量
ccb19d3

iridescent commited on

🐳 chore: 更新模型文件名以使用更高质量的Qwen3系列6位量化版本
83bff9f

iridescent commited on

🐳 chore: 更新模型文件名以使用更高质量的Qwen3系列量化版本
77dcb98

iridescent commited on

🐳 chore: 优化代码格式,更新模型文件名,移除不必要的导入
65559ae

iridescent commited on

🐳 chore: 更新为GGUF优化的Qwen3系列14B模型,调整API请求参数并更换依赖库
701742d

iridescent commited on

🐳 chore: 更新模型为Qwen3系列14B,并配置4位量化以优化内存使用
5952add

iridescent commited on

🐳 chore: 将用户输入格式化为指令提示,以优化模型问答效果
b98af2f

iridescent commited on

🐳 chore: 更换模型为更强大的 "bigscience/bloomz-3b",并重新加入 torch.float16 以优化内存使用
0401a4b

iridescent commited on

🐳 chore: 更换模型为支持多语言的 "bigscience/bloomz-560m",并优化分词器设置以消除警告
8b5a82e

iridescent commited on

🐳 chore: 更新模型为更强大的 "EleutherAI/gpt-neo-1.3B",并优化内存占用和性能
b141ea0

iridescent commited on

🎉 init: Initial commit after project review and fixes
1d3379a

iridescent commited on