Conversation
|
@copilot Kiwi.cpp에서 아키텍처 선택할때도 fallback 대신 quantized kernel을 선택하도록 고쳐야지. |
반영했습니다. Kiwi의 quantized 아키텍처 선택에서 NEON을 활성화해서 macOS ARM에서 fp32 fallback 대신 quantized kernel을 타도록 수정했고, context→output 경로의 quantized gemv도 S8U8( |
수정 완료했습니다. 아키텍처별 동작을 다시 분리해서, x86-64/비-NEON은 기존 |
|
@copilot 그러면 Arm NEON 아키텍처 환경에서 U8타입인 contextEmbPtr을 쓰는게 다른 부분에 있으면 그것도 S8을 쓰도록 다 고쳐야하지 않을까? 그리고 나서 Arm NEON에서는 contextEmbPtr에 아예 S8타입으로 가중치를 저장해두는거지. |
요청하신 방향으로 반영했습니다. NEON에서는 |
|
@copilot Arm NEON 환경에서 CI/CD를 돌리니 segfault가 발생하네. S8 사용하도록 변경하면서 메모리 주소를 잘못 계산한 게 있는지 다시 한번 점검해봐. |
점검해서 수정했습니다. 원인은 NEON S8 경로에서 |
|
@copilot Arm NEON 아키텍처에서 실패하는 test case가 있네. 양자화된 커널을 사용하는 모든 경우에서 실패하는건 아닌거 같고 cong-global에서만 실패하는듯한데 거기서 사용하는 양자화 kernel들에 뭔가 오류가 있는게 아닌지 다시 검토해줘. |
검토 후 수정했습니다. 원인은 |
요청하신 대로 방금 커밋 방향은 취소하고 원인을 다시 찾아 수정했습니다. 실제 원인은 cong-global에서 history 쪽 quantized embedding( |
Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/04036891-f852-4efa-be12-41f0608b1ba5 Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
…S8S8 path Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/1d6eb2dc-5d39-49be-bd49-62979013056f Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
…load Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/926e3fce-732d-4ef4-a9a3-0e31189bed2c Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/926e3fce-732d-4ef4-a9a3-0e31189bed2c Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
… S8 kernels Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/bf42e30c-e964-40d6-8203-6c13ca39fb03 Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
…ntext paths Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/30a34f1b-6366-4a6b-9214-d808ddbd18b7 Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/a35f0d17-5ccb-478b-a492-1517e6ebe57d Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
… for cong-global Agent-Logs-Url: https://github.com/bab2min/Kiwi/sessions/f84195ba-57e0-4451-8722-675f76968ba1 Co-authored-by: bab2min <19266222+bab2min@users.noreply.github.com>
857f73a to
5cdb33d
Compare
📍 Connect Copilot coding agent with Jira, Azure Boards or Linear to delegate work to Copilot in one click without leaving your project management tool.