当前位置：首页 > news >正文

数据结构与算法--1.判断数组中元素是否有重复

news 来源：原创 2025/4/26 4:06:44

在C语言中，我们可以使用类似的方法来实现判断数组中是否有重复值的功能。由于C语言没有内置的哈希集合（如Python的set或C++的unordered_set），我们需要自己实现一个简单的哈希表或使用其他方法。

方法一：暴力法（双重循环）
时间复杂度：O(n²)
空间复杂度：O(1)

#include <stdbool.h>bool containsDuplicate(int* nums, int numsSize) {for (int i = 0; i < numsSize; i++) {for (int j = i + 1; j < numsSize; j++) {if (nums[i] == nums[j]) {return true;}}}return false;
}

说明：

使用双重循环比较每一对元素。

如果发现相同的元素，立即返回true。

遍历结束后仍未发现重复，返回false。

方法二：先排序后比较相邻元素
时间复杂度：O(n log n)（取决于排序算法）
空间复杂度：O(1)（如果原地排序）

#include <stdbool.h>
#include <stdlib.h>// 比较函数，用于qsort
int compare(const void* a, const void* b) {return (*(int*)a - *(int*)b);
}bool containsDuplicate(int* nums, int numsSize) {qsort(nums, numsSize, sizeof(int), compare); // 使用标准库的快速排序for (int i = 0; i < numsSize - 1; i++) {if (nums[i] == nums[i + 1]) {return true;}}return false;
}

说明：

使用qsort对数组进行排序（时间复杂度一般为O(n log n)）。

遍历排序后的数组，检查相邻元素是否相同。

如果发现相同，返回true；否则返回false。

方法三：简单哈希表（适用于元素范围较小的情况）
时间复杂度：O(n)
空间复杂度：O(k)（k为元素的范围）

如果已知数组元素的范围较小（例如0 <= nums[i] <= 1000），可以用数组模拟哈希表：

#include <stdbool.h>
#include <string.h>bool containsDuplicate(int* nums, int numsSize) {// 假设元素范围为 0~1000bool seen[1001] = {false}; // 初始化所有值为falsefor (int i = 0; i < numsSize; i++) {if (seen[nums[i]]) {return true;}seen[nums[i]] = true;}return false;
}

说明：

初始化一个布尔数组seen，用于记录元素是否出现过。

遍历数组，如果seen[nums[i]]为true，说明重复，返回true。

否则，标记seen[nums[i]] = true。

遍历结束后返回false。

方法四：通用哈希表（适用于任意整数）
如果元素范围很大或未知，可以手动实现一个简单的哈希表（例如使用开放寻址法或链地址法）。以下是开放寻址法的简单实现：

#include <stdbool.h>
#include <stdlib.h>#define TABLE_SIZE 10000typedef struct {int key;bool used;
} HashEntry;HashEntry hashTable[TABLE_SIZE];// 哈希函数（简单取模）
int hash(int key) {return abs(key) % TABLE_SIZE;
}bool containsDuplicate(int* nums, int numsSize) {memset(hashTable, 0, sizeof(hashTable)); // 初始化哈希表for (int i = 0; i < numsSize; i++) {int h = hash(nums[i]);while (hashTable[h].used) {if (hashTable[h].key == nums[i]) {return true;}h = (h + 1) % TABLE_SIZE; // 线性探测}hashTable[h].key = nums[i];hashTable[h].used = true;}return false;
}

说明：

定义一个哈希表hashTable，每个槽位存储一个键和是否使用的标志。

使用取模哈希函数计算位置。

如果发生冲突，使用线性探测（h = (h + 1) % TABLE_SIZE）寻找下一个空槽。

如果找到相同的键，返回true；否则插入键并标记为已使用。

遍历结束后返回false。

方法选择建议
小规模数据：暴力法（方法一）简单直接。

中等规模数据：排序法（方法二）更高效。

元素范围较小：数组哈希表（方法三）最快。

通用情况：手动实现哈希表（方法四），但代码较复杂。

完整测试代码

#include <stdio.h>
#include <stdbool.h>
#include <stdlib.h>
#include <string.h>// 方法一：暴力法
bool containsDuplicate_bruteForce(int* nums, int numsSize) {for (int i = 0; i < numsSize; i++) {for (int j = i + 1; j < numsSize; j++) {if (nums[i] == nums[j]) {return true;}}}return false;
}// 方法二：排序法
int compare(const void* a, const void* b) {return (*(int*)a - *(int*)b);
}bool containsDuplicate_sort(int* nums, int numsSize) {qsort(nums, numsSize, sizeof(int), compare);for (int i = 0; i < numsSize - 1; i++) {if (nums[i] == nums[i + 1]) {return true;}}return false;
}// 方法三：数组哈希表（假设元素范围0~1000）
bool containsDuplicate_arrayHash(int* nums, int numsSize) {bool seen[1001] = {false};for (int i = 0; i < numsSize; i++) {if (seen[nums[i]]) {return true;}seen[nums[i]] = true;}return false;
}// 方法四：通用哈希表
#define TABLE_SIZE 10000
typedef struct {int key;bool used;
} HashEntry;HashEntry hashTable[TABLE_SIZE];int hash(int key) {return abs(key) % TABLE_SIZE;
}bool containsDuplicate_hashTable(int* nums, int numsSize) {memset(hashTable, 0, sizeof(hashTable));for (int i = 0; i < numsSize; i++) {int h = hash(nums[i]);while (hashTable[h].used) {if (hashTable[h].key == nums[i]) {return true;}h = (h + 1) % TABLE_SIZE;}hashTable[h].key = nums[i];hashTable[h].used = true;}return false;
}int main() {int nums1[] = {1, 2, 3, 1};int nums2[] = {1, 2, 3, 4};int nums3[] = {1, 1, 1, 1};printf("Brute Force:\n");printf("%d\n", containsDuplicate_bruteForce(nums1, 4)); // 1 (true)printf("%d\n", containsDuplicate_bruteForce(nums2, 4)); // 0 (false)printf("Sort:\n");printf("%d\n", containsDuplicate_sort(nums1, 4)); // 1printf("%d\n", containsDuplicate_sort(nums2, 4)); // 0printf("Array Hash:\n");printf("%d\n", containsDuplicate_arrayHash(nums1, 4)); // 1printf("%d\n", containsDuplicate_arrayHash(nums2, 4)); // 0printf("Hash Table:\n");printf("%d\n", containsDuplicate_hashTable(nums1, 4)); // 1printf("%d\n", containsDuplicate_hashTable(nums2, 4)); // 0return 0;
}

输出

Brute Force:
1
0
Sort:
1
0
Array Hash:
1
0
Hash Table:
1
0

总结
暴力法：代码简单，但效率低。

排序法：时间O(n log n)，空间O(1)或O(n)。

数组哈希表：时间O(n)，空间O(k)（需已知元素范围）。

通用哈希表：时间O(n)，空间O(m)（需处理冲突）。

量子机器学习在工业领域的首破：药物研发中的分子活性预测革命

HTML应用指南：利用POST请求获取全国小菜园门店位置信息

机器学习赋能的多尺度材料模拟与催化设计前沿技术

Ubuntu2404装机指南

Ubuntu 常用命令行指令

编译器习惯【idea】

安全用电基础知识及隐患排查重点

IntelliJ IDEA 中最常用的快捷键分类整理

制作一款打飞机游戏教程5：添加子弹

vLLM：高性能大语言模型推理引擎详解与对比分析

Linux（9）Apache

HDFS Full Block Report超限导致性能下降的原因分析

类头文件相互包含的问题

Python-8: 找出整型数组中占比超过一半的数

医疗领域的利器：深入理解3D Slicer软件

Go：使用共享变量实现并发

多种方案对比实现 Kaggle 比赛介绍进行行业分类

线代第二章矩阵第一课：矩阵的概念

数据一致性的守护神：深入Spring声明式事务管理 (@Transactional)

Redis适用场景

上海发布一组人事任免信息：钱晓、翁轶丛任市数据局副局长

商务部就海外社交平台上发布从所谓中国“代工厂”低价购买国际知名品牌事答问

调查丨当节气出现“时差”，陕西的果农们经历着什么？

拖车10公里收1900元？货车司机质疑收费过高，潮州饶平县市监局已介入

马上评丨从东方红一号到神二十，中国航天步履不停

国防部：“台独”武装摆练纯属搞心理安慰，怎么演都是溃败的死局

相关文章：