Aligning Language Models to Explicitly Handle Ambiguity (EMNLP 2024)

Code for Alignment with Perceived Ambiguity (APA)

Run

Run sh scripts/main.sh.

Change configs/main.yaml

model.name : backbone
model.offload_path : model offload path
model.cache_path : huggingface cache path
path.data : path to load dataset
path.output : output path (logs, weights, ...)
dataset.name : test dataset name
pipeline.stage_index : set from 0 or 1
explicit.template_id : explicit inference QA template
explicit.evaluation_method : 'rouge' as default
explicit.correct_threshold : generations with score above the threshold is evaluated as correct.
implicit.method_id : how to measure INFOGAIN (default 0)
implicit.disambiguation_template_id : template id for self-disambiguation
implicit.generation_template_id
implicit.threshold : threshold value to filter ambiguous queries
implicit.aggregate_method
explanation.template_id : template to generate explanations
generation.num_generations_per_prompt : generation configs
generation.num_single_generation : generation configs
generation.max_new_tokens : generation configs
generation.temperature : generation configs
ablation_methods : data selection methods
train.num_train_epochs : train configs (number of training epochs)
train.per_device_train_batch_size : train configs (train batch size)
train.gradient_accumulation_steps : train configs (gradient accumulation steps)
train.learning_rate : train configs (learning rate)

Name	Name	Last commit message	Last commit date
Latest commit heyjoonkim initial commit Sep 30, 2024 49448a3 · Sep 30, 2024 History 1 Commit
configs	configs	initial commit	Sep 30, 2024
data	data	initial commit	Sep 30, 2024
models	models	initial commit	Sep 30, 2024
pipeline	pipeline	initial commit	Sep 30, 2024
scripts	scripts	initial commit	Sep 30, 2024
utils	utils	initial commit	Sep 30, 2024
README.md	README.md	initial commit	Sep 30, 2024