Performance Review Baru: Bagaimana AI Mengubah Cara Anda Mengukur Orang

Bayangkan dua karyawan di tim sales yang sama. Satu menghasilkan 45 urutan outreach per minggu. Yang lain menghasilkan 15. Dalam logika kinerja tradisional, yang pertama adalah top performer Anda. Tapi ketika Anda melihat lebih dekat, Anda menyadari bahwa karyawan pertama menjalankan segalanya melalui asisten AI dengan pengeditan minimal, sementara yang kedua menulis lebih sedikit urutan yang lebih tajam yang menutup dengan dua kali tingkat.

Siapa yang sebenarnya berkinerja?

Pertanyaan itu tidak memiliki jawaban yang bersih di bawah sebagian besar framework kinerja yang dibangun dalam satu dekade terakhir. Dan itulah masalah yang perlu diselesaikan CHRO dan CEO sebelum siklus tinjauan berikutnya.

AI tidak hanya mengubah cara pekerjaan dilakukan. Ia merusak sistem pengukuran di bawah manajemen kinerja. Volume output, tingkat penyelesaian tugas, dan metrik aktivitas (hal-hal yang masih dilacak sebagian besar perusahaan) bukan lagi proksi yang dapat diandalkan untuk kontribusi ketika setiap karyawan memiliki akses ke tool yang secara dramatis memperkuat throughput mentah. Data workforce AI augment vs. replace menunjukkan bahwa augmentasi kini menjadi pola dominan — yang berarti masalah pengukuran bersifat universal, tidak terbatas pada perusahaan yang maju secara teknologi.

Organisasi yang pertama kali menemukan framework pengukuran baru tidak hanya akan memiliki data kinerja yang lebih baik. Mereka akan memiliki keunggulan retensi, model kompensasi yang memberikan penghargaan pada perilaku yang tepat, dan budaya yang benar-benar mempercepat adopsi AI daripada diam-diam menghukumnya.

Mengapa Metrik Tradisional Rusak

Pengukuran kinerja selalu merupakan perkiraan. Kami melacak apa yang terlihat dan terhitung karena kontribusi sulit dikuantifikasi. Selama beberapa dekade, itu bekerja cukup baik karena kesenjangan antara high performer dan rata-rata sebagian besar merupakan fungsi upaya, skill, dan fokus — semuanya berkorelasi dengan output yang dapat diamati.

AI memutus korelasi tersebut.

Ketika manajer marketing dapat menghasilkan sepuluh kali konten yang bisa dia hasilkan secara manual, volume mentah berhenti memberi sinyal upaya atau skill. Ini memberi sinyal akses AI dan kemauan untuk menggunakannya. Dan dua hal tersebut tidak secara bersih dipetakan ke siapa orang terbaik Anda.

Tiga mode kegagalan spesifik muncul dalam organisasi yang belum memperbarui framework mereka:

Inflasi output tanpa sinyal kualitas. Karyawan yang menggunakan tool AI menghasilkan lebih banyak: lebih banyak email, lebih banyak laporan, lebih banyak proposal. Tapi jika kriteria tinjauan Anda memberikan penghargaan pada volume, Anda mengukur tool, bukan orangnya. Organisasi yang mengenali masalah ini lebih awal dapat menghindari mempromosikan orang yang salah berdasarkan metrik aktivitas yang meningkat. Framework keputusan eksekutif untuk strategi AI workforce mengatasi bagaimana kesenjangan pengukuran terhubung dengan keputusan strategi workforce yang lebih luas.

Metrik kecepatan yang memberikan penghargaan pada early adopter, belum tentu performer kuat. Karyawan pertama yang mengadopsi AI akan menunjukkan keuntungan produktivitas yang dramatis terlepas dari kemampuan dasar mereka. Jika tinjauan Q1 Anda memberikan penghargaan pada kecepatan tersebut, Anda memberikan rating tinggi kepada orang yang mengadopsi tool pertama, bukan orang yang menerapkan pertimbangan terbaik, menghasilkan kualitas pekerjaan tertinggi, atau membuat tim di sekitar mereka menjadi lebih baik.

Persepsi manajer yang tertinggal dari pergeseran aktual. Penelitian dari studi kemampuan organisasi McKinsey 2025 menemukan bahwa skor persepsi manajer menyimpang dari metrik output yang terukur hingga 35% dalam tim di mana adopsi AI paling tinggi. Manajer meremehkan karyawan fasih AI yang bekerja dengan tenang dan efisien, dan berlebih-lebihan menilai aktivitas yang terlihat pada karyawan yang tampak sibuk tapi menghasilkan pekerjaan berkualitas lebih rendah.

Hasilnya adalah sistem manajemen kinerja yang perlahan salah mengukur workforce Anda. Dan salah ukur pada skala memiliki konsekuensi serius: orang yang salah dipromosikan, orang yang salah hilang, dan kompensasi yang terkait dengan metrik yang tidak lagi mencerminkan nilai.

Seperti Apa Kinerja yang Baik Sekarang

Daripada mencoba memperbaiki metrik yang rusak secara bertahap, pendekatan yang lebih bersih adalah menetapkan dimensi kinerja baru yang mencerminkan apa yang sebenarnya penting dalam lingkungan yang ditingkatkan AI. Ada tiga.

Dimensi 1: AI Output Ratio

AI output ratio adalah ukuran seberapa efektif seseorang memperkuat output mereka menggunakan AI relatif terhadap rekan-rekan dalam peran yang sama. Ini bukan tentang volume mentah. Ini tentang pengalinya.

Performer yang kuat tidak hanya menggunakan AI lebih banyak. Mereka menggunakannya lebih cerdas. Mereka tahu kapan harus mempercayai output AI, kapan harus menulis ulang, kapan harus menolak. Mereka telah mengembangkan workflow yang membuat AI benar-benar berguna daripada cepat secara superfisial. Dan mereka menghasilkan pekerjaan yang bertahan di bawah pengawasan, di mana lapisan pertimbangan jelas milik mereka.

Dalam praktik, mengukur AI output ratio berarti beralih dari hitungan aktivitas menuju rasio output-ke-kualitas. Berapa banyak dari apa yang mereka hasilkan yang digunakan, disetujui, atau dikonversi ke hilir? Rep sales dengan 60 urutan yang dikonversi 4% memiliki rasio lebih tinggi dari yang dengan 120 urutan yang dikonversi 1,5%.

Ini memerlukan membangun feedback loop yang mungkin belum dimiliki sistem Anda saat ini. Tapi bisa dilacak, dan ini adalah sinyal yang tepat.

Dimensi 2: Kualitas dan Pertimbangan

AI menghasilkan draft pertama pada skala. Kontribusi manusia dalam workflow yang ditingkatkan AI semakin tentang pertimbangan: menangkap kesalahan, menambahkan konteks, menerapkan keahlian domain yang tidak dimiliki model.

Dimensi ini bertanya: seberapa baik seseorang dalam melihat apa yang salah dilakukan AI? Dalam menambahkan apa yang tidak bisa dilakukan AI?

Analis keuangan yang dapat mengidentifikasi tiga asumsi yang terkubur dalam model yang dihasilkan AI yang akan menyebabkannya gagal dalam kondisi nyata berkinerja pada tingkat tinggi. Marketer yang tahu kapan pesan yang benar secara teknis yang dihasilkan AI akan mendarat salah dengan audiens tertentu menambahkan nilai yang tidak muncul dalam volume output.

Pertimbangan sulit dikuantifikasi, tapi tidak tak terlihat. Ini muncul dalam tingkat kesalahan ke hilir, dalam seberapa sering pekerjaan seseorang memerlukan revisi signifikan oleh orang lain, dan dalam umpan balik kualitatif dari orang-orang yang bergantung pada output mereka. Proses tinjauan rekan terstruktur yang secara khusus mempertanyakan tentang kualitas pertimbangan, bukan hanya kuantitas output, memberi Anda data di sini.

Dimensi 3: Kolaborasi dan Transfer Pengetahuan

Ini adalah dimensi yang paling banyak diabaikan oleh framework kinerja, dan mungkin yang paling penting secara strategis untuk transformasi AI.

Beberapa karyawan tidak hanya menggunakan AI dengan baik. Mereka membuat rekan satu tim mereka lebih baik dalam menggunakan AI. Mereka berbagi workflow, mendokumentasikan prompt yang berhasil, membangun sistem bersama, dan menurunkan hambatan adopsi bagi rekan yang lebih lambat beradaptasi. Ini persis perilaku yang dirancang untuk dimunculkan dan diberikan penghargaan oleh program AI champions formal — mengubah transfer pengetahuan informal menjadi kontribusi terstruktur yang dapat dinilai.

Kontribusi tersebut sangat besar. Seorang karyawan yang membawa tiga kolega yang ragu ke dalam penggunaan AI yang efektif telah menggandakan kemampuan AI organisasi. Tapi di bawah framework kinerja tradisional, tidak ada yang muncul. Ini terlihat seperti waktu yang tidak dihabiskan untuk output pribadi.

Organisasi yang ditingkatkan AI berkinerja tinggi mulai memperlakukan transfer pengetahuan dan AI enablement tim sebagai perilaku kinerja yang dapat dinilai — bukan tambahan yang lunak, tapi kriteria aktual dengan bobot dalam tinjauan.

Mendesain Ulang Siklus Tinjauan

Mengubah apa yang Anda ukur hanya setengah dari pekerjaan. Anda juga perlu mengubah proses dan kalibrasi.

Yang Ditambahkan ke Kriteria Kinerja pada 2026

Tabel di bawah ini menunjukkan tampilan sebelum/sesudah dari bagaimana kriteria kinerja seharusnya bergeser:

Dimensi Kriteria Tradisional Kriteria yang Diperbarui
Produktivitas Volume penyelesaian tugas, hitungan aktivitas AI output ratio, konversi output-ke-kualitas
Kualitas Tingkat kesalahan pada deliverable Akurasi pertimbangan, tingkat revisi ke hilir
Pertumbuhan Penyelesaian pelatihan skill Kemahiran tool AI, adopsi workflow baru
Kolaborasi Partisipasi rapat, proyek tim Transfer pengetahuan AI, enablement rekan
Inisiatif Melampaui pekerjaan yang ditugaskan Membangun sistem AI bersama, mendokumentasikan praktik terbaik

Tujuannya bukan untuk membuang kriteria yang ada sepenuhnya. Ini untuk membobotkan ulang dan menambahkan dimensi yang kini penting.

Yang Dihapus atau Dibobot Ulang

Volume output mentah dan metrik aktivitas harus dipindahkan dari indikator primer ke sekunder — konteks daripada kriteria evaluasi. Jika seseorang menghasilkan dua kali volume dengan setengah kualitas, volumenya bukan sinyalnya.

Metrik kecepatan harus dipisahkan dari rating kinerja. Seberapa cepat seseorang mengadopsi AI lebih awal pada 2025 atau 2026 tidak memprediksi seberapa baik mereka menggunakannya sekarang, dan itu tentu tidak memprediksi kontribusi jangka panjang. Kecepatan adopsi adalah leading indicator, bukan dimensi kinerja.

Cara Mengkalibrasi Di Seluruh Pemisahan Adopter dan Non-Adopter AI

Di sinilah sebagian besar organisasi tersandung. Di setiap tim yang diberikan, Anda akan memiliki karyawan yang secara bermakna telah mengintegrasikan AI ke dalam workflow mereka dan karyawan yang belum. Jika Anda mengkalibrasi rating kinerja pada skala tunggal tanpa memperhitungkan hal ini, Anda pada dasarnya menilai karyawan pada campuran kontribusi dan adopsi tool mereka.

Pendekatan yang tepat adalah memperlakukan kemahiran AI sebagai sumbu terpisah selama kalibrasi daripada membiarkannya diam-diam mendistorsi rating di seluruh papan. Selama sesi kalibrasi tinjauan, manajer harus secara eksplisit menandai di mana adopsi AI adalah faktor dalam perbedaan output, dan menyesuaikan perbandingan sesuai.

Ini tidak berarti non-adopter mendapat pengecualian. Kegagalan untuk mengadopsi tool AI yang tersedia dan relevan untuk suatu peran adalah masalah kinerja, tapi harus diperlakukan sebagai satu secara eksplisit, bukan dipanggang secara tidak terlihat ke dalam rating.

Implikasi Kompensasi

Pertanyaan apakah mengikat AI fluency ke kompensasi adalah salah satu perdebatan yang lebih tajam dalam people ops saat ini. Data premium gaji AI fluency untuk 2026 memberi CHRO benchmark pasar eksternal untuk mengkalibrasi di mana harus menetapkan penyesuaian kompensasi terkait AI. Jawabannya tergantung pada perilaku yang Anda coba dorong.

Jika AI fluency adalah ekspektasi dasar untuk suatu peran (artinya pekerjaan secara harfiah membutuhkannya sekarang), itu tidak seharusnya menghasilkan premium. Ini adalah table stakes. Membayar ekstra untuk menggunakan tool standar peran ini seperti memberikan bonus untuk menggunakan email. Anda akan menciptakan budaya penggunaan AI yang ditampilkan daripada adopsi yang tulus.

Tapi jika AI fluency melampaui ekspektasi — jika seorang karyawan melakukan pekerjaan yang sebelumnya tidak mungkin, menghasilkan outcome pada tingkat yang benar-benar mengubah apa yang bisa disampaikan peran — maka pengakuan kompensasi itu tepat dan kritis untuk retensi. Menurut survei HR Gartner 2025, 48% karyawan fasih AI berkinerja tinggi menyebut keyakinan bahwa kontribusi AI mereka tidak tercermin dalam kompensasi sebagai alasan utama untuk mempertimbangkan pindah.

Risiko inaksi di sini bersifat asimetris. Orang paling mampu AI Anda memiliki pilihan. Perusahaan yang membiarkan AI fluency tidak diakui dalam kompensasi akan kehilangan mereka ke organisasi yang tidak melakukan itu.

Pertimbangan Hukum dan Keadilan

Adopsi AI tidak terjadi secara seragam di seluruh workforce. Dan pola siapa yang mengadopsi dan siapa yang tidak cenderung berkorelasi dengan faktor-faktor yang menciptakan risiko hukum.

Karyawan yang lebih tua, terutama yang berusia di atas 50, mengadopsi tool AI pada tingkat yang lebih rendah rata-rata. Penelitian OECD tentang AI dan transisi pasar tenaga kerja mendokumentasikan pola ini dan mencatat bahwa akses yang berbeda ke pelatihan — bukan resistensi — seringkali merupakan driver utama dari kesenjangan adopsi di seluruh kohort usia. Karyawan dalam tipe peran tertentu atau dengan masa kerja lebih lama mungkin memiliki workflow yang lebih tertanam yang lebih sulit diubah. Jika rating kinerja bergeser secara signifikan berdasarkan adopsi AI, dan adopsi AI berkorelasi dengan usia atau masa kerja, Anda memiliki masalah dampak yang tidak proporsional di bawah hukum diskriminasi ketenagakerjaan.

Ini tidak berarti Anda tidak bisa meminta pertanggungjawaban karyawan atas kegagalan mengembangkan kemampuan yang relevan. Itu berarti Anda perlu memastikan akses yang adil ke pelatihan dan dukungan sebelum Anda mengikat kemampuan tersebut ke outcome kinerja. Organisasi yang membuat program AI upskilling hanya untuk departemen atau level tertentu, kemudian mengevaluasi semua orang pada kemahiran AI, sedang mengekspos diri mereka.

Jalur yang lebih bersih: dokumentasikan ketersediaan pelatihan AI dan penyelesaian sebelum menerapkan kriteria AI fluency. Buat dukungan dapat diakses di seluruh kelompok usia, peran, dan masa kerja. Checklist onboarding AI untuk 2026 adalah titik awal yang berguna untuk memastikan akses yang adil di seluruh workforce Anda sebelum Anda mengikat penyelesaian pelatihan ke outcome tinjauan. Dan libatkan penasihat hukum saat Anda merancang struktur kompensasi yang terkait dengan tingkat adopsi AI.

Perusahaan yang melakukan ini dengan benar juga membangun perlindungan non-retaliation eksplisit bagi karyawan yang mengangkat kekhawatiran tentang tool AI — baik karena itu adalah kebijakan yang tepat maupun karena menciptakan sinyal bahwa organisasi tersebut bijaksana tentang tekanan adopsi.

Apa Artinya Ini di Tingkat Board

Pengukuran kinerja mungkin tampak seperti masalah operasional HR, tapi implikasi strategisnya berada tepat di tingkat board.

Organisasi yang salah dalam pengukuran selama transformasi AI akan mengalami dua masalah yang berlipat ganda. Pertama, mereka akan mempromosikan orang karena alasan yang salah, membangun lapisan manajemen penuh karyawan yang memainkan metrik adopsi awal daripada orang yang menjalankan pertimbangan yang kuat dalam konteks yang ditingkatkan AI. Kedua, mereka akan kehilangan orang terbaik mereka ke perusahaan yang memang mengakui kontribusi AI secara akurat, karena top performer tahu nilai mereka.

Kedua masalah itu mahal dan lambat untuk dipulihkan.

CHRO yang membawa framework kinerja yang didesain ulang ke board bukan hanya mempresentasikan inisiatif HR. Mereka mempresentasikan strategi retensi talent, mekanisme pembangunan kemampuan, dan pembeda kompetitif untuk menarik orang-orang yang benar-benar akan mendorong masa depan AI organisasi.

Pengukuran kinerja adalah levernya. Lakukan dengan benar, dan transformasi AI workforce dipercepat karena orang yang tepat diberikan penghargaan dan dipertahankan. Lakukan dengan salah, dan Anda menjalankan program transformasi sambil diam-diam mendegradasi lapisan pertimbangan manusia yang membuat output AI benar-benar berguna.

Itu bukan tradeoff yang harus membuat eksekutif mana pun merasa nyaman.


Pelajari Lebih Lanjut