fix: use absolute path for sonar-scanner
This commit is contained in:
1
.claude/hooks/.tool-counter
Normal file
1
.claude/hooks/.tool-counter
Normal file
@@ -0,0 +1 @@
|
|||||||
|
19
|
||||||
16
.claude/sessions/latest.json
Normal file
16
.claude/sessions/latest.json
Normal file
@@ -0,0 +1,16 @@
|
|||||||
|
{
|
||||||
|
"timestamp": "2026-03-24T18:22:41Z",
|
||||||
|
"branch": "main",
|
||||||
|
"phase": "unknown",
|
||||||
|
"modified_files": [
|
||||||
|
"RESEARCH-SDD-TOOLS.md"
|
||||||
|
],
|
||||||
|
"staged_files": [],
|
||||||
|
"recent_commits": [
|
||||||
|
"0351a0f refactor: adjust agent model assignments based on role analysis",
|
||||||
|
"db5ba04 feat: expand agents (10), skills (20), and hooks (11) with profile system",
|
||||||
|
"cf86a91 docs: sync documentation with actual repo state; adapt for Gitea",
|
||||||
|
"6c644dd chore: remove .github templates (moved to Gitea)",
|
||||||
|
"ea21818 feat: add meta-skill create-skill for creating and improving skills"
|
||||||
|
]
|
||||||
|
}
|
||||||
@@ -64,8 +64,8 @@ steps:
|
|||||||
SONAR_TOKEN:
|
SONAR_TOKEN:
|
||||||
from_secret: sonar_token
|
from_secret: sonar_token
|
||||||
commands:
|
commands:
|
||||||
- export PATH="/opt/sonar-scanner-6.2.1.4610-linux-x64/bin:$PATH"
|
- # sonar-scanner path set below
|
||||||
- sonar-scanner -Dsonar.token=$SONAR_TOKEN
|
- /opt/sonar-scanner-6.2.1.4610-linux-x64/bin/sonar-scanner -Dsonar.token=$SONAR_TOKEN
|
||||||
depends_on: [lint, test]
|
depends_on: [lint, test]
|
||||||
|
|
||||||
# Uncomment when deploy script is set up on VPS:
|
# Uncomment when deploy script is set up on VPS:
|
||||||
|
|||||||
@@ -228,3 +228,186 @@ Evolve skills based on patches (ai-factory aif-evolve)
|
|||||||
- Spec Kit README: https://github.com/github/spec-kit
|
- Spec Kit README: https://github.com/github/spec-kit
|
||||||
- AI Factory README: https://github.com/lee-to/ai-factory
|
- AI Factory README: https://github.com/lee-to/ai-factory
|
||||||
- AI Factory AGENTS.md: https://github.com/lee-to/ai-factory/blob/2.x/AGENTS.md
|
- AI Factory AGENTS.md: https://github.com/lee-to/ai-factory/blob/2.x/AGENTS.md
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
Глубокий Research: SDD-инструменты и AI-assisted Development (март 2026)
|
||||||
|
|
||||||
|
Ландшафт: что произошло с момента твоего исследования
|
||||||
|
|
||||||
|
Твой RESEARCH-SDD-TOOLS.md от 2026-02-22 зафиксировал Spec Kit и AI Factory. За 2 недели ландшафт значительно расширился:
|
||||||
|
|
||||||
|
Spec Kit вырос до 74.6K stars, 110+ релизов, поддерживает 22+ агентов. Но получил серьёзную критику:
|
||||||
|
- CTO Scott Logic: "sea of markdown documents, long agent run-times and unexpected friction" — spec в 4x длиннее финального кода
|
||||||
|
- Martin Fowler/Thoughtworks: "like using a sledgehammer to crack a nut" для мелких задач
|
||||||
|
- Главная проблема: агенты не следуют инструкциям даже при больших контекстных окнах — "Just because context windows are larger doesn't mean AI will properly pick up on everything"
|
||||||
|
|
||||||
|
AI Factory — v2.6.0 (5 марта 2026), 7 релизов за 15 дней. Очень активная разработка. Добавили extensions system, persist explore context (RESEARCH.md), docs policy checkpoint, incremental evolve, self-update.
|
||||||
|
|
||||||
|
Новые игроки, которых нет в твоём research:
|
||||||
|
|
||||||
|
┌─────────────────┬────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬─────────────┐
|
||||||
|
│ Инструмент │ Суть │ Статус │
|
||||||
|
├─────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┼─────────────┤
|
||||||
|
│ AWS Kiro │ Enterprise SDD с deep AWS интеграцией, 3 фазы (Specify→Plan→Execute), сильный brownfield support │ Production │
|
||||||
|
├─────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┼─────────────┤
|
||||||
|
│ Tessl Framework │ Самый амбициозный — "spec-as-source", reverse-engineers specs из кода, Spec Registry с 10K+ библиотек против hallucination API │ Closed beta │
|
||||||
|
├─────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┼─────────────┤
|
||||||
|
│ BMAD Method │ AI personas (Analyst, PM, Architect, Dev, QA), docs-as-code, epic sharding для context collapse │ V6 stable │
|
||||||
|
├─────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┼─────────────┤
|
||||||
|
│ Qodo Rules │ AI governance — auto-generates, enforces, measures coding standards как policy │ Production │
|
||||||
|
├─────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┼─────────────┤
|
||||||
|
│ Beads (bd CLI) │ Git-backed graph-oriented issue tracker как external memory для агентов │ Active │
|
||||||
|
├─────────────────┼────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┼─────────────┤
|
||||||
|
│ Repomix │ Пакует repo в single AI-friendly файл, MCP server mode, Tree-sitter compression │ Mature │
|
||||||
|
└─────────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴─────────────┘
|
||||||
|
|
||||||
|
---
|
||||||
|
Ключевые паттерны индустрии (консенсус 2026)
|
||||||
|
|
||||||
|
1. Constitution Files — универсальный стандарт
|
||||||
|
|
||||||
|
Каждый инструмент теперь имеет "конституцию":
|
||||||
|
- Spec Kit: memory/constitution.md — 9 Articles of Development (Library-First, Test-First, Simplicity Gate...)
|
||||||
|
- Claude Code: CLAUDE.md — "as important as .gitignore"
|
||||||
|
- Cursor: .cursor/rules/*.mdc с glob-scoped auto-attachment
|
||||||
|
- Windsurf: .windsurfrules + автогенерируемые Memories
|
||||||
|
- BMAD: PRD + Architecture docs как versioned constitutional assets
|
||||||
|
|
||||||
|
У тебя: RULES.md + agents/ — это уже конституция, но без pre-implementation gates и phase gates.
|
||||||
|
|
||||||
|
2. Deterministic Orchestration + Bounded Agents
|
||||||
|
|
||||||
|
QuantumBlack (McKinsey) — ключевой инсайт: "Agents are good at generating content within a bounded problem; they struggle with meta-level decisions about workflow sequencing." Letting agents self-orchestrate
|
||||||
|
fails at scale.
|
||||||
|
|
||||||
|
Выигрывающая архитектура:
|
||||||
|
Deterministic orchestration layer (pipeline, DAG)
|
||||||
|
→ Agents generate content within bounded problems
|
||||||
|
→ Two-layer quality gates:
|
||||||
|
1. Deterministic checks (linters, tests, structural validation)
|
||||||
|
2. Critic agent validates against definition of done
|
||||||
|
|
||||||
|
Cursor's 1M-line browser (GPT-5.2): failed с equal-status agents, succeeded с hierarchy Planners → Workers → Judges.
|
||||||
|
|
||||||
|
3. Iterative Loops — наука за ними
|
||||||
|
|
||||||
|
Академические результаты подтверждают эффективность:
|
||||||
|
- Reflexion (Shinn et al.): GPT-4 HumanEval 67% → 88% (+21pp) через self-reflection
|
||||||
|
- Self-Refine (Madaan et al.): +5% to +40% improvement через FEEDBACK→REFINE loop
|
||||||
|
- CYCLE: до 63.5% relative improvement, причём маленькая модель с refinement побеждает большую без
|
||||||
|
|
||||||
|
Критический инсайт по stopping criteria: Secure Code Reflexion показал diminishing returns — Round 1: +6.00pp, Round 2: +1.66pp, Round 3: +1.03pp. Большая часть improvement в первой итерации.
|
||||||
|
|
||||||
|
4. Quality Gates — двухслойная модель
|
||||||
|
|
||||||
|
Индустриальный консенсус:
|
||||||
|
1. Layer 1 (deterministic): linters, test suites, type checking, structural validation — быстро, reliable
|
||||||
|
2. Layer 2 (critic agent): dedicated LLM validates output against definition of done — для judgment calls
|
||||||
|
|
||||||
|
LLM-as-Judge: binary (pass/fail) или 3-point scales надёжнее 10-point scales. Strong judges: 80-90% agreement с humans. Multi-dimensional weighted rubrics работают для кода.
|
||||||
|
|
||||||
|
Scoring biases: verbosity bias (длинный = лучше), self-preference bias, position bias. Mitigation: разные model families для generator и judge.
|
||||||
|
|
||||||
|
5. Self-Improvement — работает, но дорого
|
||||||
|
|
||||||
|
- Darwin Godel Machine (Sakana AI): SWE-bench 20% → 50% через self-modification. Но стоит ~$22K и 2 недели.
|
||||||
|
- Roblox: PR acceptance rate 30% → 60% через structured human feedback + domain expert labeling.
|
||||||
|
- AI Factory aif-evolve: practical approach — mandatory patches после каждого fix, cursor-based incremental processing, skill-context overlays.
|
||||||
|
- Writer: RL from self-reflection с minimal catastrophic forgetting.
|
||||||
|
|
||||||
|
Практичный подход: не self-modification кода агента, а structured memory из прошлых ошибок (patches → pattern extraction → skill improvement).
|
||||||
|
|
||||||
|
6. Memory/Persistence — file-based побеждает
|
||||||
|
|
||||||
|
Vercel's experiment: 8KB AGENTS.md = 100% pass rate на Next.js 16 eval suite (vs 79% для complex skills approach). Presence of AGENTS.md = 29% reduction в runtime, 17% reduction в output tokens.
|
||||||
|
|
||||||
|
Letta benchmark: plain filesystem = 74% на memory tasks, beating specialized vector stores.
|
||||||
|
|
||||||
|
Memory hierarchy (CPU cache analogy):
|
||||||
|
- L1 (always loaded): CLAUDE.md / RULES.md — 2-10KB
|
||||||
|
- L2 (on-demand): Skills, file references — progressive disclosure
|
||||||
|
- L3 (session history): Conversation with compaction
|
||||||
|
- L4 (external retrieval): RAG, codebase search
|
||||||
|
|
||||||
|
7. Anti-Hallucination — 10-layer defence
|
||||||
|
|
||||||
|
Layered defence model (от простого к сложному):
|
||||||
|
1. Specification grounding (spec-first)
|
||||||
|
2. RAG-based grounding (retrieve relevant code/docs)
|
||||||
|
3. Confidence gates (100/100 or INSUFFICIENT INFORMATION)
|
||||||
|
4. Chain-of-thought verification with citations
|
||||||
|
5. Deterministic post-validation (linters, tests)
|
||||||
|
6. Critic agent validation
|
||||||
|
7. Cross-model QA
|
||||||
|
8. Forced uncertainty markers ([NEEDS CLARIFICATION])
|
||||||
|
9. Request classification (repo/doc/external-grounded)
|
||||||
|
10. Spec Registry для external APIs
|
||||||
|
|
||||||
|
Шокирующая находка: "Maximum Effective Context Window" (MECW) dramatically ниже рекламируемого. Hallucination rates at 2000+ tokens = до 99% для некоторых моделей. Less context, better structured > more
|
||||||
|
context.
|
||||||
|
|
||||||
|
8. Claude Code Ecosystem — best practices
|
||||||
|
|
||||||
|
CLAUDE.md: target 50-100 lines, structure as WHAT/WHY/HOW, prefer pointers over copies, document what Claude gets wrong. Не используй для code style — linters дешевле и быстрее.
|
||||||
|
|
||||||
|
Skills: limit to 20-30 high-quality (quality > quantity). Progressive disclosure: metadata ~100 tokens for scanning, full body <5K when triggered.
|
||||||
|
|
||||||
|
Hooks: 12 lifecycle events, deterministic (always run). Key: PreToolUse для blocking, PostToolUse для auto-format/auto-commit.
|
||||||
|
|
||||||
|
Context: start fresh sessions per task (#1 tip), manual /compact at max 50%, Claude Code uses 5.5x fewer tokens than Cursor.
|
||||||
|
|
||||||
|
---
|
||||||
|
Что это значит для твоего AI_template
|
||||||
|
|
||||||
|
Сильные стороны (что ты уже сделал лучше многих)
|
||||||
|
|
||||||
|
1. RULES.md — уже функционирует как конституция, чётко и лаконично
|
||||||
|
2. 15 skills — хорошее покрытие lifecycle, правильная progressive disclosure архитектура
|
||||||
|
3. 5 hooks — protect-files, bash-firewall, post-edit-format, audit-log, commit-docs-reminder
|
||||||
|
4. 7 agent profiles — covers key domains
|
||||||
|
5. Modular archetype system — 5 archetypes + mix & match modules
|
||||||
|
|
||||||
|
Критические пробелы (приоритизированные по impact)
|
||||||
|
|
||||||
|
P0 — Высший приоритет (фундамент):
|
||||||
|
|
||||||
|
1. /specify skill — Structured spec creation с [NEEDS CLARIFICATION] markers (max 3), separation WHAT/WHY vs HOW, checklists as "unit tests for spec quality". Output: specs/[feature]/spec.md
|
||||||
|
2. /plan skill — Technical plan с pre-implementation gates (Simplicity Gate, Anti-Abstraction Gate, Integration-First Gate). Output: specs/[feature]/plan.md + tasks.md
|
||||||
|
3. Two-layer quality gate в /review skill — сейчас у тебя review как code review. Нужно усилить: Layer 1 (deterministic: run linters/tests/build) + Layer 2 (critic agent against spec/plan)
|
||||||
|
|
||||||
|
P1 — Высокий приоритет (iterative quality):
|
||||||
|
|
||||||
|
4. /loop skill — Reflex loop PRODUCE→EVALUATE→CRITIQUE→REFINE. Two-phase scoring (0.8/0.9). Stagnation detection (delta < 0.02). Persist state (run.json + history.jsonl) для resume после /clear. Max 3-5
|
||||||
|
iterations (research shows diminishing returns after round 1-2)
|
||||||
|
5. /grounded skill — Confidence gate: classify request (repo/doc/external), mandatory verification for changeable facts, 100/100 or INSUFFICIENT INFORMATION. Strict output format.
|
||||||
|
|
||||||
|
P2 — Средний приоритет (learning):
|
||||||
|
|
||||||
|
6. /fix + patch system — Mandatory learning artifact после каждого bug fix в patches/YYYY-MM-DD-HH.mm.md. Problem, Root Cause, Solution, Prevention, Tags.
|
||||||
|
7. /evolve skill — Cursor-based incremental processing patches → pattern extraction → skill-context overlays. Никогда не модифицирует base skills, только overlays.
|
||||||
|
|
||||||
|
P3 — Улучшения:
|
||||||
|
|
||||||
|
8. Constitution pattern — Формализовать immutable principles в отдельный файл (или секцию RULES.md) с phase gates. Сейчас RULES.md смешивает operational rules и architectural principles.
|
||||||
|
9. Task parallelization — [P] markers в task lists + execution waves (Wave 1: parallel independent, Wave 2: depends on Wave 1...).
|
||||||
|
10. CLAUDE.md generation — сейчас нет CLAUDE.md в проекте. /init-project skill должен генерировать его из RULES.md + RECOMMENDATIONS.md.
|
||||||
|
|
||||||
|
---
|
||||||
|
Рекомендуемый порядок реализации
|
||||||
|
|
||||||
|
Phase A: Spec-first foundation
|
||||||
|
/specify → /plan → enhance /review with two-layer gates
|
||||||
|
|
||||||
|
Phase B: Iterative quality
|
||||||
|
/loop → /grounded
|
||||||
|
|
||||||
|
Phase C: Learning system
|
||||||
|
/fix (patches) → /evolve (skill improvement)
|
||||||
|
|
||||||
|
Phase D: Polish
|
||||||
|
Constitution formalization → Task parallelization → CLAUDE.md generation
|
||||||
|
|
||||||
|
Каждая фаза самостоятельно ценна — можно остановиться после любой.
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user