开源项目教程：Repository-Level Prompt Generation for Large Language Models of Code

repo_level_prompt_generation项目地址:https://gitcode.com/gh_mirrors/re/repo_level_prompt_generation

项目介绍

本项目名为“Repository-Level Prompt Generation for Large Language Models of Code”，由Disha Shrivastava、Hugo Larochelle和Daniel Tarlow共同开发。该项目旨在通过学习生成特定示例的提示，利用整个仓库的上下文来设计针对大型代码语言模型（LLMs）的提示。这种方法不需要访问LLM的权重，适用于只有黑盒访问权限的场景。

项目快速启动

环境准备

克隆项目仓库：




git clone https://github.com/shrivastavadisha/repo_level_prompt_generation.git


cd repo_level_prompt_generation

安装依赖：

pip install -r requirements.txt

运行示例

以下是一个简单的示例，展示如何生成规则上下文表示：

python generate_rule_representations.py --data_split=val --repo=jata4test --emb_model_type=codebert

应用案例和最佳实践

应用案例

本项目的一个典型应用案例是单行代码自动补全。通过从Google Code存档中提取的代码仓库进行实验，证明了使用本项目生成的提示可以显著提高代码自动补全的质量。

最佳实践

上下文利用：确保在生成提示时充分利用整个仓库的上下文信息，包括导入文件和父类文件。模型选择：根据具体需求选择合适的嵌入模型类型（如CodeBERT）。数据分割：在实验和训练过程中，合理分割数据集（如验证集和测试集）。

典型生态项目

本项目与以下生态项目紧密相关：

GitHub Copilot：作为代码助手，GitHub Copilot利用类似的技术来提供代码建议和自动补全。CodeBERT：一种用于代码理解和生成的预训练模型，本项目中使用了CodeBERT来生成规则上下文表示。

通过结合这些生态项目，可以进一步扩展和优化本项目的应用场景和性能。

repo_level_prompt_generation项目地址:https://gitcode.com/gh_mirrors/re/repo_level_prompt_generation

随笔

特别提醒: 内容为用户自行发布,如有侵权,请联系我们管理员删除,邮箱:mail@xieniao.com ,在收到您的邮件后我们会在3个工作日内处理。

PSCID 使用教程

随笔

7个月前

0660

支付宝和淘宝欺诈形式的保证金好会恶心人啊？ – 淘宝天猫

随笔

1年前

01930

http1.1与http2.0

随笔

7个月前

0610

为什么买家做出晒图评价无法显示？ – 淘宝天猫

随笔

1年前

02490

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

开源项目教程：Repository-Level Prompt Generation for Large Language Models of Code