机器伦理的哲学基础、基本特征与实现方法

成果类型:
期刊论文
署名作者:
廖备水(1)
署名单位:
(1)浙江大学哲学学院,杭州310058
刊物名称:
中国社会科学
ISSN/ISSBN:
1002-9695
发表日期:
2024
页码:
126-142
关键词:
伦理对齐 可解释性 大语言模型 知识表示与推理
摘要:
随着人工智能系统自主决策能力的不断提升,如何赋予智能体的决策以足够伦理考量成为一个备受关注的重要挑战。解决这一问题的关键途径是建立机器伦理,即将人类伦理价值观和道德规范嵌入人工智能系统,使其具备伦理对齐能力。机器伦理建立在人类伦理的基础上,但具有与人类伦理不同的基本特征。首先,当前的智能机器尚无现实主义意义上的主体性和体验性,表现为在伦理决策方面的弱主体性。其次,机器的决策反映的是受其行为影响的人类利益相关方的伦理考量,因此,机器的伦理决策需要在不同利益相关方的价值诉求之间取得平衡,即具备社会平衡性。再次,机器在伦理决策时容易受到文化因素的影响,应能反映文化差异性。最后,机器需要向人类主体解释伦理决策、理解情感表达,并进行责任归因,因此必须具备良好的人机交互性。
来源URL: