SwanHubX
diff --git a/‎.vitepress/en.ts‎
Lines changed: 1 addition & 0 deletions b/‎.vitepress/en.ts‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎.vitepress/zh.ts‎
Lines changed: 1 addition & 0 deletions b/‎.vitepress/zh.ts‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎en/guide_cloud/general/what-is-swanlab.md‎
Lines changed: 12 additions & 11 deletions b/‎en/guide_cloud/general/what-is-swanlab.md‎
Lines changed: 12 additions & 11 deletions
diff --git a/‎en/guide_cloud/integration/diffsynth/logo.png‎
6.15 MB b/‎en/guide_cloud/integration/diffsynth/logo.png‎
6.15 MB
diff --git a/‎en/guide_cloud/integration/diffsynth/ui-1.png‎
350 KB b/‎en/guide_cloud/integration/diffsynth/ui-1.png‎
350 KB
diff --git a/‎en/guide_cloud/integration/diffsynth/ui-2.png‎
201 KB b/‎en/guide_cloud/integration/diffsynth/ui-2.png‎
201 KB
diff --git a/‎en/guide_cloud/integration/integration-diffsynth-studio.md‎
Lines changed: 135 additions & 0 deletions b/‎en/guide_cloud/integration/integration-diffsynth-studio.md‎
Lines changed: 135 additions & 0 deletions
diff --git a/‎zh/guide_cloud/general/what-is-swanlab.md‎
Lines changed: 2 additions & 1 deletion b/‎zh/guide_cloud/general/what-is-swanlab.md‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎zh/guide_cloud/integration/diffsynth/logo.png‎
6.15 MB b/‎zh/guide_cloud/integration/diffsynth/logo.png‎
6.15 MB
diff --git a/‎zh/guide_cloud/integration/diffsynth/ui-1.png‎
350 KB b/‎zh/guide_cloud/integration/diffsynth/ui-1.png‎
350 KB
@@ -162,6 +162,7 @@ function sidebarIntegration(): DefaultTheme.SidebarItem[] {
     items: [
       { text: 'Argparse', link:'integration-argparse' },
       { text: 'Ascend NPU & MindSpore', link: 'integration-ascend' },
+      { text: 'DiffSynth-Studio', link: 'integration-diffsynth-studio' },
       { text: 'EasyR1', link: 'integration-easyr1' },
       { text: 'Fastai', link: 'integration-fastai' },
     ]
 
@@ -178,6 +178,7 @@ function sidebarIntegration(): DefaultTheme.SidebarItem[] {
     items: [
       { text: 'Argparse', link:'integration-argparse' },
       { text: 'Ascend NPU & MindSpore', link: 'integration-ascend' },
+      { text: 'DiffSynth-Studio', link: 'integration-diffsynth-studio' },
       { text: 'EasyR1', link: 'integration-easyr1' },
       { text: 'Fastai', link: 'integration-fastai' },
     ]
 
@@ -92,18 +92,19 @@ Below is a list of frameworks we have integrated, please submit [Issue](https://
 - [Keras](/en/guide_cloud/integration/integration-keras.html)
 
 **Specialized/Fine-tuned Frameworks**
-- [PyTorch Lightning](/en/guide_cloud/integration/integration-pytorch-lightning.html)
-- [HuggingFace Transformers](/en/guide_cloud/integration/integration-huggingface-transformers.html)
+- [PyTorch Lightning](/guide_cloud/integration/integration-pytorch-lightning.html)
+- [HuggingFace Transformers](/guide_cloud/integration/integration-huggingface-transformers.html)
+- [LLaMA Factory](/guide_cloud/integration/integration-llama-factory.html)
+- [Modelscope Swift](/guide_cloud/integration/integration-swift.html)
+- [DiffSynth-Studio](/guide_cloud/integration/integration-diffsynth-studio.html)
+- [Sentence Transformers](/guide_cloud/integration/integration-sentence-transformers.html)
 - [OpenMind](https://modelers.cn/docs/zh/openmind-library/1.0.0/basic_tutorial/finetune/finetune_pt.html#%E8%AE%AD%E7%BB%83%E7%9B%91%E6%8E%A7)
-- [LLaMA Factory](/en/guide_cloud/integration/integration-llama-factory.html)
-- [Modelscope Swift](/en/guide_cloud/integration/integration-swift.html)
-- [Sentence Transformers](/en/guide_cloud/integration/integration-sentence-transformers.html)
-- [Torchtune](/en/guide_cloud/integration/integration-pytorch-torchtune.html)
-- [XTuner](/en/guide_cloud/integration/integration-xtuner.html)
-- [MMEngine](/en/guide_cloud/integration/integration-mmengine.html)
-- [FastAI](/en/guide_cloud/integration/integration-fastai.html)
-- [LightGBM](/en/guide_cloud/integration/integration-lightgbm.html)
-- [XGBoost](/en/guide_cloud/integration/integration-xgboost.html)
+- [Torchtune](/guide_cloud/integration/integration-pytorch-torchtune.html)
+- [XTuner](/guide_cloud/integration/integration-xtuner.html)
+- [MMEngine](/guide_cloud/integration/integration-mmengine.html)
+- [FastAI](/guide_cloud/integration/integration-fastai.html)
+- [LightGBM](/guide_cloud/integration/integration-lightgbm.html)
+- [XGBoost](/guide_cloud/integration/integration-xgboost.html)
 
 
 **Computer Vision**
 
@@ -0,0 +1,135 @@
+# DiffSynth Studio
+
+[DiffSynth-Studio](https://github.com/modelscope/DiffSynth-Studio) is an open-source diffusion model engine launched by [ModelScope](https://modelscope.cn/), focusing on image and video style transfer and generation tasks. By optimizing architectural designs (such as text encoders, UNet, VAE, and other components), it significantly enhances computational performance while maintaining compatibility with open-source community models, providing users with an efficient and flexible creative tool.
+
+DiffSynth Studio supports various diffusion models, including Wan-Video, StepVideo, HunyuanVideo, CogVideoX, FLUX, ExVideo, Kolors, Stable Diffusion 3, and more.
+
+![](./diffsynth/logo.png)
+
+You can use DiffSynth Studio to quickly train Diffusion models while using SwanLab for experiment tracking and visualization.
+
+[[toc]]
+
+## Preparation
+
+**1. Clone the Repository and Set Up the Environment**
+
+```bash
+git clone https://github.com/modelscope/DiffSynth-Studio.git
+cd DiffSynth-Studio
+pip install -e .
+pip install swanlab
+```
+
+**2. Prepare the Dataset**
+
+The dataset for DiffSynth Studio needs to be structured in the following format. For example, place the image data in the `data/dog` directory:
+
+```bash
+data/dog/
+└── train
+    ├── 00.jpg
+    ├── 01.jpg
+    ├── 02.jpg
+    ├── 03.jpg
+    ├── 04.jpg
+    └── metadata.csv
+```
+
+The `metadata.csv` file should be structured as follows:
+
+```csv
+file_name,text
+00.jpg,A small dog
+01.jpg,A small dog
+02.jpg,A small dog
+03.jpg,A small dog
+04.jpg,A small dog
+```
+
+**3. Prepare the Model**
+
+Here, we use the Kolors model as an example. Download the model weights and VAE weights:
+
+```bash
+modelscope download --model=Kwai-Kolors/Kolors --local_dir models/kolors/Kolors
+modelscope download --model=AI-ModelScope/sdxl-vae-fp16-fix --local_dir models/kolors/sdxl-vae-fp16-fix
+```
+
+## Setting SwanLab Parameters
+
+When running the training script, add `--use_swanlab` to record the training process on the SwanLab platform.
+
+If you need offline recording, you can add `--swanlab_mode "local"`.
+
+```bash {3,4}
+CUDA_VISIBLE_DEVICES="0" python examples/train/kolors/train_kolors_lora.py \
+...
+--use_swanlab \
+--swanlab_mode "cloud"
+```
+
+## Starting the Training
+
+Use the following command to start the training and record hyperparameters, training logs, loss curves, and other information using SwanLab:
+
+```bash {11,12}
+CUDA_VISIBLE_DEVICES="0" python examples/train/kolors/train_kolors_lora.py \
+--pretrained_unet_path models/kolors/Kolors/unet/diffusion_pytorch_model.safetensors \
+--pretrained_text_encoder_path models/kolors/Kolors/text_encoder \
+--pretrained_fp16_vae_path models/kolors/sdxl-vae-fp16-fix/diffusion_pytorch_model.safetensors \
+--dataset_path data/dog \
+--output_path ./models \
+--max_epochs 10 \
+--center_crop \
+--use_gradient_checkpointing \
+--precision "16-mixed" \
+--use_swanlab \
+--swanlab_mode "cloud"
+```
+
+![](./diffsynth/ui-1.png)
+
+![](./diffsynth/ui-2.png)
+
+## Additional Notes
+
+If you want to customize SwanLab project names, experiment names, and other parameters, you can:
+
+**1. Text-to-Image Tasks**
+
+In the `DiffSynth-Studio/diffsynth/trainers/text_to_image.py` file, locate the `swanlab_logger` variable and modify the `project` and `name` parameters:
+
+```python {6-7}
+if args.use_swanlab:
+    from swanlab.integration.pytorch_lightning import SwanLabLogger
+    swanlab_config = {"UPPERFRAMEWORK": "DiffSynth-Studio"}
+    swanlab_config.update(vars(args))
+    swanlab_logger = SwanLabLogger(
+        project="diffsynth_studio", 
+        name="diffsynth_studio",
+        config=swanlab_config,
+        mode=args.swanlab_mode,
+        logdir=args.output_path,
+    )
+    logger = [swanlab_logger]
+```
+
+**2. Wan-Video Text-to-Video Tasks**
+
+In the `DiffSynth-Studio/examples/wanvideo/train_wan_t2v.py` file, locate the `swanlab_logger` variable and modify the `project` and `name` parameters:
+
+```python {6-7}
+if args.use_swanlab:
+    from swanlab.integration.pytorch_lightning import SwanLabLogger
+    swanlab_config = {"UPPERFRAMEWORK": "DiffSynth-Studio"}
+    swanlab_config.update(vars(args))
+    swanlab_logger = SwanLabLogger(
+        project="wan", 
+        name="wan",
+        config=swanlab_config,
+        mode=args.swanlab_mode,
+        logdir=args.output_path,
+    )
+    logger = [swanlab_logger]
+```
@@ -105,10 +105,11 @@ SwanLab 面向人工智能研究者，设计了友好的Python API 和漂亮的U
 **专有/微调框架**
 - [PyTorch Lightning](/guide_cloud/integration/integration-pytorch-lightning.html)
 - [HuggingFace Transformers](/guide_cloud/integration/integration-huggingface-transformers.html)
-- [OpenMind](https://modelers.cn/docs/zh/openmind-library/1.0.0/basic_tutorial/finetune/finetune_pt.html#%E8%AE%AD%E7%BB%83%E7%9B%91%E6%8E%A7)
 - [LLaMA Factory](/guide_cloud/integration/integration-llama-factory.html)
 - [Modelscope Swift](/guide_cloud/integration/integration-swift.html)
+- [DiffSynth-Studio](/guide_cloud/integration/integration-diffsynth-studio.html)
 - [Sentence Transformers](/guide_cloud/integration/integration-sentence-transformers.html)
+- [OpenMind](https://modelers.cn/docs/zh/openmind-library/1.0.0/basic_tutorial/finetune/finetune_pt.html#%E8%AE%AD%E7%BB%83%E7%9B%91%E6%8E%A7)
 - [Torchtune](/guide_cloud/integration/integration-pytorch-torchtune.html)
 - [XTuner](/guide_cloud/integration/integration-xtuner.html)
 - [MMEngine](/guide_cloud/integration/integration-mmengine.html)
Original file line number	Diff line number	Diff line change
`@@ -162,6 +162,7 @@ function sidebarIntegration(): DefaultTheme.SidebarItem[] {`
`162`	`162`	`items: [`
`163`	`163`	`{ text: 'Argparse', link:'integration-argparse' },`
`164`	`164`	`{ text: 'Ascend NPU & MindSpore', link: 'integration-ascend' },`
	`165`	`+ { text: 'DiffSynth-Studio', link: 'integration-diffsynth-studio' },`
`165`	`166`	`{ text: 'EasyR1', link: 'integration-easyr1' },`
`166`	`167`	`{ text: 'Fastai', link: 'integration-fastai' },`
`167`	`168`	`]`
Original file line number	Diff line number	Diff line change
`@@ -178,6 +178,7 @@ function sidebarIntegration(): DefaultTheme.SidebarItem[] {`
`178`	`178`	`items: [`
`179`	`179`	`{ text: 'Argparse', link:'integration-argparse' },`
`180`	`180`	`{ text: 'Ascend NPU & MindSpore', link: 'integration-ascend' },`
	`181`	`+ { text: 'DiffSynth-Studio', link: 'integration-diffsynth-studio' },`
`181`	`182`	`{ text: 'EasyR1', link: 'integration-easyr1' },`
`182`	`183`	`{ text: 'Fastai', link: 'integration-fastai' },`
`183`	`184`	`]`