text-generation-webui

mirror of https://github.com/oobabooga/text-generation-webui.git synced 2025-12-06 07:12:10 +01:00

Author	SHA1	Message	Date
oobabooga	d423021a48	Remove CTransformers support (#5807 )	2024-04-04 20:23:58 -03:00
oobabooga	2a92a842ce	Bump gradio to 4.23 (#5758 )	2024-03-26 16:32:20 -03:00
oobabooga	28076928ac	UI: Add a new "User description" field for user personality/biography (#5691 )	2024-03-11 23:41:57 -03:00
oobabooga	056717923f	Document StreamingLLM	2024-03-10 19:15:23 -07:00
oobabooga	afb51bd5d6	Add StreamingLLM for llamacpp & llamacpp_HF (2nd attempt) (#5669 )	2024-03-09 00:25:33 -03:00
Bartowski	104573f7d4	Update cache_4bit documentation (#5649 ) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>	2024-03-07 13:08:21 -03:00
oobabooga	2ec1d96c91	Add cache_4bit option for ExLlamaV2 (#5645 )	2024-03-06 23:02:25 -03:00
oobabooga	2174958362	Revert gradio to 3.50.2 (#5640 )	2024-03-06 11:52:46 -03:00
oobabooga	63a1d4afc8	Bump gradio to 4.19 (#5522 )	2024-03-05 07:32:28 -03:00
oobabooga	a6730f88f7	Add --autosplit flag for ExLlamaV2 (#5524 )	2024-02-16 15:26:10 -03:00
oobabooga	76d28eaa9e	Add a menu for customizing the instruction template for the model (#5521 )	2024-02-16 14:21:17 -03:00
oobabooga	080f7132c0	Revert gradio to 3.50.2 (#5513 )	2024-02-15 20:40:23 -03:00
oobabooga	7123ac3f77	Remove "Maximum UI updates/second" parameter (#5507 )	2024-02-14 23:34:30 -03:00
oobabooga	acfbe6b3b3	Minor doc changes	2024-02-06 06:35:01 -08:00
oobabooga	8a6d9abb41	Small fixes	2024-02-06 06:26:27 -08:00
oobabooga	2a1063eff5	Revert "Remove non-HF ExLlamaV2 loader (#5431 )" This reverts commit `cde000d478`.	2024-02-06 06:21:36 -08:00
oobabooga	8c35fefb3b	Add custom sampler order support (#5443 )	2024-02-06 11:20:10 -03:00
Forkoz	2a45620c85	Split by rows instead of layers for llama.cpp multi-gpu (#5435 )	2024-02-04 23:36:40 -03:00
oobabooga	cde000d478	Remove non-HF ExLlamaV2 loader (#5431 )	2024-02-04 01:15:51 -03:00
oobabooga	e055967974	Add prompt_lookup_num_tokens parameter (#5296 )	2024-01-17 17:09:36 -03:00
oobabooga	53dc1d8197	UI: Do not save unchanged settings to settings.yaml	2024-01-09 18:59:04 -08:00
oobabooga	2aad91f3c9	Remove deprecated command-line flags (#5131 )	2023-12-31 02:07:48 -03:00
oobabooga	2734ce3e4c	Remove RWKV loader (#5130 )	2023-12-31 02:01:40 -03:00
oobabooga	0e54a09bcb	Remove exllamav1 loaders (#5128 )	2023-12-31 01:57:06 -03:00
oobabooga	8e397915c9	Remove --sdp-attention, --xformers flags (#5126 )	2023-12-31 01:36:51 -03:00
oobabooga	8c60495878	UI: add "Maximum UI updates/second" parameter	2023-12-24 09:17:40 -08:00
oobabooga	2706149c65	Organize the CMD arguments by group (#5027 )	2023-12-21 00:33:55 -03:00
oobabooga	9992f7d8c0	Improve several log messages	2023-12-19 20:54:32 -08:00
oobabooga	de138b8ba6	Add llama-cpp-python wheels with tensor cores support (#5003 )	2023-12-19 17:30:53 -03:00
oobabooga	0a299d5959	Bump llama-cpp-python to 0.2.24 (#5001 )	2023-12-19 15:22:21 -03:00
oobabooga	a23a004434	Update the example template	2023-12-18 17:47:35 -08:00
Water	674be9a09a	Add HQQ quant loader (#4888 ) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>	2023-12-18 21:23:16 -03:00
oobabooga	f1f2c4c3f4	Add --num_experts_per_token parameter (ExLlamav2) (#4955 )	2023-12-17 12:08:33 -03:00
oobabooga	3bbf6c601d	AutoGPTQ: Add --disable_exllamav2 flag (Mixtral CPU offloading needs this)	2023-12-15 06:46:13 -08:00
oobabooga	1c531a3713	Minor cleanup	2023-12-12 13:25:21 -08:00
oobabooga	39d2fe1ed9	Jinja templates for Instruct and Chat (#4874 )	2023-12-12 17:23:14 -03:00
oobabooga	8c8825b777	Add QuIP# to README	2023-12-08 08:40:42 -08:00
oobabooga	2c5a1e67f9	Parameters: change max_new_tokens & repetition_penalty_range defaults (#4842 )	2023-12-07 20:04:52 -03:00
oobabooga	98361af4d5	Add QuIP# support (#4803 ) It has to be installed manually for now.	2023-12-06 00:01:01 -03:00
oobabooga	131a5212ce	UI: update context upper limit to 200000	2023-12-04 15:48:34 -08:00
oobabooga	be88b072e9	Update --loader flag description	2023-12-04 15:41:25 -08:00
Lounger	7c0a17962d	Gallery improvements (#4789 )	2023-12-03 22:45:50 -03:00
oobabooga	2769a1fa25	Hide deprecated args from Session tab	2023-11-21 15:15:16 -08:00
oobabooga	ef6feedeb2	Add --nowebui flag for pure API mode (#4651 )	2023-11-18 23:38:39 -03:00
oobabooga	8f4f4daf8b	Add --admin-key flag for API (#4649 )	2023-11-18 22:33:27 -03:00
oobabooga	e0ca49ed9c	Bump llama-cpp-python to 0.2.18 (2nd attempt) (#4637 ) * Update requirements.txt Add back seed	2023-11-18 00:31:27 -03:00
oobabooga	9d6f79db74	Revert "Bump llama-cpp-python to 0.2.18 (#4611 )" This reverts commit `923c8e25fb`.	2023-11-17 05:14:25 -08:00
oobabooga	13dc3b61da	Update README	2023-11-16 19:57:55 -08:00
oobabooga	8b66d83aa9	Set use_fast=True by default, create --no_use_fast flag This increases tokens/second for HF loaders.	2023-11-16 19:55:28 -08:00
oobabooga	923c8e25fb	Bump llama-cpp-python to 0.2.18 (#4611 )	2023-11-16 22:55:14 -03:00
oobabooga	4aabff3728	Remove old API, launch OpenAI API with --api	2023-11-10 06:39:08 -08:00
oobabooga	6e2e0317af	Separate context and system message in instruction formats (#4499 )	2023-11-07 20:02:58 -03:00
oobabooga	af3d25a503	Disable logits_all in llamacpp_HF (makes processing 3x faster)	2023-11-07 14:35:48 -08:00
oobabooga	ec17a5d2b7	Make OpenAI API the default API (#4430 )	2023-11-06 02:38:29 -03:00
feng lui	4766a57352	transformers: add use_flash_attention_2 option (#4373 )	2023-11-04 13:59:33 -03:00
Julien Chaumond	fdcaa955e3	transformers: Add a flag to force load from safetensors (#4450 )	2023-11-02 16:20:54 -03:00
oobabooga	c0655475ae	Add cache_8bit option	2023-11-02 11:23:04 -07:00
oobabooga	77abd9b69b	Add no_flash_attn option	2023-11-02 11:08:53 -07:00
oobabooga	1edf321362	Lint	2023-10-23 13:09:03 -07:00
oobabooga	df90d03e0b	Replace --mul_mat_q with --no_mul_mat_q	2023-10-22 12:23:03 -07:00
oobabooga	2d1b3332e4	Ignore warnings on Colab	2023-10-21 21:45:25 -07:00
oobabooga	506d05aede	Organize command-line arguments	2023-10-21 18:52:59 -07:00
cal066	cc632c3f33	AutoAWQ: initial support (#3999 )	2023-10-05 13:19:18 -03:00
oobabooga	b6fe6acf88	Add threads_batch parameter	2023-10-01 21:28:00 -07:00
jllllll	41a2de96e5	Bump llama-cpp-python to 0.2.11	2023-10-01 18:08:10 -05:00
oobabooga	f931184b53	Increase truncation limits to 32768	2023-09-28 19:28:22 -07:00
StoyanStAtanasov	7e6ff8d1f0	Enable NUMA feature for llama_cpp_python (#4040 )	2023-09-26 22:05:00 -03:00
oobabooga	1ca54faaf0	Improve --multi-user mode	2023-09-26 06:42:33 -07:00
oobabooga	7f1460af29	Change a warning	2023-09-25 20:22:27 -07:00
oobabooga	d0d221df49	Add --use_fast option (closes #3741 )	2023-09-25 12:19:43 -07:00
oobabooga	00ab450c13	Multiple histories for each character (#4022 )	2023-09-21 17:19:32 -03:00
oobabooga	5075087461	Fix command-line arguments being ignored	2023-09-19 13:11:46 -07:00
missionfloyd	2ad6ca8874	Add back chat buttons with --chat-buttons (#3947 )	2023-09-16 00:39:37 -03:00
saltacc	f01b9aa71f	Add customizable ban tokens (#3899 )	2023-09-15 18:27:27 -03:00
oobabooga	3d1c0f173d	User config precedence over GGUF metadata	2023-09-14 12:15:52 -07:00
oobabooga	2f935547c8	Minor changes	2023-09-12 15:05:21 -07:00
oobabooga	c2a309f56e	Add ExLlamaV2 and ExLlamav2_HF loaders (#3881 )	2023-09-12 14:33:07 -03:00
oobabooga	dae428a967	Revamp cai-chat theme, make it default	2023-09-11 19:30:40 -07:00
oobabooga	ed86878f02	Remove GGML support	2023-09-11 07:44:00 -07:00
oobabooga	cec8db52e5	Add max_tokens_second param (#3533 )	2023-08-29 17:44:31 -03:00
oobabooga	36864cb3e8	Use Alpaca as the default instruction template	2023-08-29 13:06:25 -07:00
Cebtenzzre	2f5d769a8d	accept floating-point alpha value on the command line (#3712 )	2023-08-27 18:54:43 -03:00
oobabooga	f4f04c8c32	Fix a typo	2023-08-25 07:08:38 -07:00
oobabooga	52ab2a6b9e	Add rope_freq_base parameter for CodeLlama	2023-08-25 06:55:15 -07:00
oobabooga	d6934bc7bc	Implement CFG for ExLlama_HF (#3666 )	2023-08-24 16:27:36 -03:00
oobabooga	7cba000421	Bump llama-cpp-python, +tensor_split by @shouyiwang, +mul_mat_q (#3610 )	2023-08-18 12:03:34 -03:00
oobabooga	73d9befb65	Make "Show controls" customizable through settings.yaml	2023-08-16 07:04:18 -07:00
oobabooga	ccfc02a28d	Add the --disable_exllama option for AutoGPTQ (#3545 from clefever/disable-exllama)	2023-08-14 15:15:55 -03:00
oobabooga	d8a82d34ed	Improve a warning	2023-08-14 08:46:05 -07:00
oobabooga	619cb4e78b	Add "save defaults to settings.yaml" button (#3574 )	2023-08-14 11:46:07 -03:00
oobabooga	a1a9ec895d	Unify the 3 interface modes (#3554 )	2023-08-13 01:12:15 -03:00
Chris Lefever	0230fa4e9c	Add the --disable_exllama option for AutoGPTQ	2023-08-12 02:26:58 -04:00
cal066	7a4fcee069	Add ctransformers support (#3313 ) --------- Co-authored-by: cal066 <cal066@users.noreply.github.com> Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> Co-authored-by: randoentity <137087500+randoentity@users.noreply.github.com>	2023-08-11 14:41:33 -03:00
jllllll	bee73cedbd	Streamline GPTQ-for-LLaMa support	2023-08-09 23:42:34 -05:00
oobabooga	d8fb506aff	Add RoPE scaling support for transformers (including dynamic NTK) https://github.com/huggingface/transformers/pull/24653	2023-08-08 21:25:48 -07:00
Friedemann Lipphardt	901b028d55	Add option for named cloudflare tunnels (#3364 )	2023-08-08 22:20:27 -03:00
oobabooga	a373c96d59	Fix a bug in modules/shared.py	2023-08-06 20:36:35 -07:00
oobabooga	3d48933f27	Remove ancient deprecation warnings	2023-08-06 18:58:59 -07:00
oobabooga	0af10ab49b	Add Classifier Free Guidance (CFG) for Transformers/ExLlama (#3325 )	2023-08-06 17:22:48 -03:00
oobabooga	8df3cdfd51	Add SSL certificate support (#3453 )	2023-08-04 13:57:31 -03:00

1 2 3 4 5 ...

325 commits